Experiment more, pay less for your AWS ML

Cпікер: Дмитро Кузьменко, ML Engineer у Infopulse та ML Researcher в University of Toronto

9 серпня 2022

Онлайн

9 серпня Дмитро Кузьменко, ML Engineer у Infopulse та ML Researcher в University of Toronto, проведе онлайн мітап на тему: Еволюція зорових трансформерів. Від ViT до GC ViT та Next-ViT.

 

Комп’ютерний зір зазнав великого буму ще на початку 2010-х. З тих часів виникло багато різноманітних архітектур та підходів для вирішення великої кількості задач. Перші згорткові мережі були дуже громіздкі та повільні, їх було майже неможливо впровадити на системи, де швидкість є надзвичайно важливою. Попит на задачі з картинками та відео зростав, але для успішної комерціалізації проєктів нейронні мережі оптимізовували, пришвидшували, полегшували, та прискорювали.

 

Однією з цікавих та нових архітектур в задачах комп’ютерного зору є Vision Transformers, або ж Зорові Трансформери. Запозичивши й адаптувавши механізм уваги та енкодер-декодер частину архітектури від задач NLP, ця ланка в розвитку моделей змогла досягти великих успіхів як на бенчмарках, так і спокійно могла бути портована на Edge девайси. Про них ми докладніше поговоримо на мітапі.

 

Проте, в ViT була певна кількість недоліків та було достатньо місця для суттєвих покращень. Тож, ми також поговоримо на найновіші та найпотужніші модифікації цього підходу, детально розберемо червневу статтю від NVIDIA про GC ViT, які покращують attention механізм, розширюючи його на локальний та глобальний контекстуальні рівні та зануримось у зовсім свіжий пейпер від ByteDance про Next-ViT – зорові трансформери наступного покоління, створені для ефективного розгортання в реалістичних industry сценаріях.

 

Також, порівняємо бенчмарки нових моделей, поговоримо про можливі застосування та подальший розвиток напрямку досліджень.

 

Мітап корисний для досвідчених інженерів та рісьорчерів в комп’ютерному зорі; junior спеціалістам та початківцям, які хочуть краще розібратись з однією з найновіших архітектур та її деталями; а також всім, кому цікава тема комп’ютерного зору і технічні деталі сучасних моделей.

Де? Online

Коли? 9 серпня о 19:00 (Київський час)

Квитки: https://bit.ly/3aSaFLI

100% коштів від продажу квитків будуть переведені у благодійний фонд Твоя Опора для закупівлі апартів для дитячої реанімації, де рятують життя дітей, які постраждали внаслідок російської агресії.

До зустрічі!