Проф. Мартин Вечев, INSAIT: България може да създава AI модели и за други държави
Създателят на института за бъдещето на българския изкуствен интелект, ролята на държавата и как бизнесът работи с новите модели
Седмичният бюлетин на Капитал и Digitalk DemistifAI е вашия източник на информация за еволюцията на изкуствения интелект и неговото въздействие върху бизнеса.
Визитка
Проф. Мартин Вечев е основателят и архитектът зад INSAIT. Професор е в ETH Zurich и водещ учен в света на компютърните науки и изкуствения интелект. Той е единственият българин, носител на два гранта на Европейския съвет за научни изследвания. Проф. Вечев също така е предприемач и съосновател на три deep-tech стартъпа. Носител е на различни международни награди, сред които и "Джон Атанасов", за постижения в областта на компютърните и информационните технологии.
Какво място може да има България и българският технологичен сектор в развитието на изкуствения интелект?
Изкуственият интелект се развива много мощно последните години и тук, общо взето, нещата се разделят на ползватели на изкуствен интелект и такива, които създават и осигуряват този напредък. Tова, което сега се случва с INSAIT и BgGPT и с моделите зад BgGPT, е, че България за първи път става място, където всъщност се създава този изкуствен интелект. И интересното е, че така се изгражда и един вид екосистема. Бизнесът взима тези модели и почва да надгражда над тях. Тоест България започва да играе роля като място, където всъщност нещата се измислят и създават.- Ще задържим талантите тук. И ще променим страната
- Новият институт в София и картата, на която искаме да ни има
Смятате ли, че българският бизнес е готов за подобно бурно навлизане на изкуствения интелект?
Това, което виждаме ние, е с BgGPT, който има чат и модели зад него, е как бизнесът успява да вземе тези модели и много бързо да ги надгради буквално за няколко часа в определен вертикал, например образование или застраховане. И за него излиза много по-евтино, отколкото да плаща на ОpenAI. И това нещо работи на ниво GPT 4, който е платен модел. И това е изключителна новина, защото ти осигурява един вид автономност на организацията - вече си имаш собствен модел, собствен изкуствен интелект и можеш да го ползваш вътре в организацията. Ти си запазваш данните, имаш информационна сигурност по дефиниция, защото данните не излизат от организацията.Тоест вече наблюдавате интерес?
Да, и то много голям интерес. Става дума за много легитимни играчи в екосистемата.А къде виждате ролята на INSAIT в развитието на този потенциал в изкуствения интелект?
INSAIT всъщност вече работи по много направления, не само изкуствен интелект. То самият изкуствен интелект има много поднаправления - работи в квантовите изчисления, информационната сигурност, компютърното зрение и роботиката и др. Имаме редица партньорства с големи организация, някои от тях дори не са обявени.INSAIT позиционира България като място, където се измисля технологията, т.е. сменя имиджа на България. И всичко има този ефект - дали е BgGPT, дали са други разработки или статии - институтът позиционира България като висококачествена дестинация по подобие на Израел или Швейцария. А не да сме само известни като аутсорсинг дестинация. Всъщност BgGPT е само един от вертикалите - изкуственият интелект има модели, които ще специализират в много вертикали.
А какви са следващите стъпки на INSAIT в развитието на тези модели?
Някои от тях можем да обявим, други не. Едните са тези текстови модели като BgGPT. И пак да кажем защо са важни за позиционирането на България. BgGPT не е просто доработване на някакъв модел, в него има много технология. И България може да предложи на други държави от региона да им създаде регионални модели. Много малко са държавите в света, които имат собствени отворени модели, над които бизнесът и държавните организации могат да надграждат. Работим и в други вертикали - в сферата на роботиката, в сателитните данни. Тепърва ще обявяваме още проекти и вертикали в следващите месеци.За какво бизнесът може да се обръща към INSAIT освен BgGPT, какво партньорство може да предложите?
INSAIT работи по подобие на други институти като ETH в Цюрих, MIT, Technion в Израел и други. Искаме да следваме един шаблон, който знаем, че работи. И тези структури работят по различни начини с бизнеса. Например ЕTH дълги години работи със стартъпи - институтът прави общи проекти с компании от сферата на дълбоките технологии. В България няма много такива фирми, но стават все повече и с тях могат да се правят общи проекти, в които да работят и докторанти и магистри от INSAIT. Бизнесът казва: нямаме нужните ресурси, дай да работим с INSAIT или MIT, или който и да е. И опитът ни показва, че чрез подобно сътрудничество стават най-мощните продукти на компаниите, които носят и най-големи приходи.Това, което смятаме, че липсва, е хора с мощна база от знания, които да правят изследвания. Защото те са синомим на "измислянето" - ако нямаш рисърч, нямаш и иновации. И когато говорим за научни статии, ако нямаш статии на топ конференции, ти си извън играта. Да дам пример: INSAIT вече публикува няколко статии в NeurIPS. България в историята си няма статии там. А в NeurIPS, например, е публикувана технологията зад ChatGPT. Когато теб те няма там, ти не може да си държавата, в която се измислят нови неща. Това е нещо, което INSAIT иска да промени. И това не е само плюс за INSAIT, а за цялата екосистема. Защото някакви хора си казват: щом има INSAIT и такива неща се правят, значи може да отворим офис тук и да работим с INSAIT.
Какви са основните предизвикателства пред бизнеса, за да борави по-добре с AI технологии и модели като BgGPT?
Смятам, че един огромен, фундаментален reset е как изведнъж с тези базови модели хора, които не са чак толкова големи експерти по изкуствен интелект, могат да го специализират и да получат готов продукт. И в бизнеса се вижда как компании успяват да го специализират бързо и да го надградят. Това е много важно - да скъсиш нужните знания, за да можеш бързо да изграждаш продукти. И затова това, което се случва с BgGPT, е много важно. И затова трябва да продължим да изграждаме такива модели.Кои индустрии се възползват най-добре?
Всичките - няма сектор, където да не навлезе. Дали е образование, дали е застраховане, дали медии, просто ще трябва да се научим да работим добре с тези модели и те ще вдигнат производителността ни - ще станем по-ефективни и по-креативни също. Не може да бъде спряна тази технология.Кои индустрии са най-слабо подготвени за изкуствен интелект?
Трудно е да се каже. Образованието е нещо, където трябва да се внимава с отговора (при езиковите модели) - когато имаш нещо, което е вярно и невярно.Какъв съвет ще дадете към бизнеса, който трябва да внедрява езикови модели?
Според мен бизнесът знае какво трябва да прави, не е нужно ние да му даваме съвет, нито пък сме експерти по всичко. Трябва да следи новостите в изкуствения интелект и да ги изпробва, трябва да го прегърне един вид и да се учи. Наблюдаваме как в някои организации, които искат да го внедряват, трябва да има специалист по машинно обучение, който разбира как да интегрира и надгражда тези модели. Защото има организации, които имат много хора, имат данните и искат да внедряват модели, но не разполагат с такъв човек.Предвиждате ли подобно съдействие към компаниите?
Да, даже сме намислили изграждането на общество, един вид Slack група, но просто не ни стигат ресурсите. Защото не е целта всичко да се централизира около INSAIT. Идеята на INSAIT е да споделя цялата информация - затова и пускаме всички модели абсолютно безплатно, не само можеш да ги свалиш, но и лицензът е Аpache 2.0, който ти позволява да извършваш и комерсиална дейност. И затова планираме да направим общество, в което хората да споделят какво са постигнали досега.
През какви етапи преминава обучението на такъв модел?
Има затворени модели и отворени модели. Затворените са като на OpenAI и Google - ти можеш да си чатиш с него, да го специализираш, но той е някъде другаде. Отворените са публично достъпни - Mistral, Llama и др. Те са обучени по някакъв начин - взимат информация от интернет и т.н. И INSAIT стъпва на този базов модел - ние го взимаме, следва пак обучение с нов dataset, примерно 10 млрд. думи нови данни, после следва обучение с данни само на български, които ние имаме - от държавни агенции, дружества и т.н., след това има специализация - тъй нареченият fine tuning, и после и още стъпки, за да стане добър модел. И този модел, който вече пуснахме, е нещо като базов модел, който бизнесът специализира в някакъв вертикал. И разходите за обучение спрямо големината на модела са много различни - в момента е 7-милиардният, а спрямо 70-милиардния разликата може да достигне и 1 млн. лв.Тук е важно да се каже, че имаме прецедент - обучението на модела и използването му от обществото се прави с частни дарения. Публични средства не са изхарчени за създаването на BgGPT. INSAIT има партньорства с много мощни центрове на някои от най-големите компании в света, които предоставят част от тези ресурси безплатно, другата част ние покриваме с дарения. Това са големи разходи за изграждане на този базов модел, който обществото след това трябва да специализира. Така че да имаш това нещо е абсолютно стратегическо и е важно веднага да можеш да вертикализираш 50-100 направления. И в момента когато го направиш, ти вече имаш данни как се използва това нещо и то става още по-добро.
5 коментара
"Изкуственият интелект се развива много мощно последните години и тук"
:) Вярно е :)))
Браво, продължавайте все така.
Това е бъдещето, вие сте нашите надежди за развитие на България.
Нов коментар
За да публикувате коментари,
трябва да сте регистриран потребител.