Якщо хтось пропустив — OpenAI викотили мультимодальний режим ChatGPT. Це коли ти в одному чаті ШІ може створювати картинки, бачити їх, запускати код і читати документи. І навіть створювати ШІ-асистентів для вузькопрофільних задач, даючи їм доступ — наприклад — до читання вашого календаря, щоб керувати графіком.
Але головна драма новин в тому, що обновка ставить могильний хрест на 100500 сервісах типу askyourpdf.com. Вони дозволяли аналізувати документи з ШІ; шукати інформацію, створювати підсумки й ставити питання. Щоб це працювало, ці сервіси різали документи на шматки й векторизували їх — грубо кажучи, знаходили числове значення змісту. Ці значення складали в спеціальну базу даних, а потім підсовували релевантні фрагменти в контекст ШІ.
Працює це так. Наприклад, користувач питає "Як звали мого кота?"
, і у цього питання вектор [1, 2]
. Де 1
— це семантичний зв'язок з котом, а 2
— з іменем. Після цього береться база даних уривків з документа, і шукається найближчий, наприклад: [1.01, 1.98] "Якби у мене був кіт, його б звали Сім-Сім"
.
І коли для користувача здається, що це розумний ШІ читає його документ, для ШІ запит користувача виглядає ось так.
System: Ти доскоцький ШІ-допомагач. Використовуючи контекст документа користувача, відповідай на запитання.
Assitant: На сторінці 12 документу "Untitled.pdf", написано. "Якби у мене був кіт, його б звали Сім-Сім".
User: "Як звали мого кота?"
Вулична магія, загалом, була не першого ґатунку. Інструкція буквально лежить в документації API в якості Hello word. А тепер це все роблять OpenAI самі: якісно, з API та гарним інтерфейсом. Використовують, до речі, опенсорсний Qdrant, як і Grok Маска.
Всі дивуються, як OpenAI могли підкласти таку свиню своїм же клієнтам, що приносили справно гроші за доступ до API. Я ж вважаю, що свиня — як Чеховське ружжо — висіла на стіні з самого початку.
І заряджена ця свиня була довгостроковою стратегією OpenAI.
Для OpenAI вигідно, щоб якнайбільше послуг, великих і маленьких, інтегрувались з їх ШІ; а люди — такими послугами масово користувались. Для цього треба, щоб кожен Тарас і Микола мав свою суперідею, як ШІ йому може допомогти. Тоді довгостроково вийде заробити сотні мільярдів.
Але біда в тому, що без наочного прикладу, суперідея у Тараса й Миколи не з'явиться. Знаєте, коли випустили до людей GPT-3, p ідентичними можливостями до ChatGPT, що підняв фурор рік назад?
У 2020 році.
І чули ви про нього у 2020 році? Мабуть, ні. А якщо і чули, то не сприймали серйозно.
Лише хіба якщо ви ветеран AiDungeon, де задроти грали з ще зовсім молодим ШІ в ігри, що змушували OpenAI трястись від жаху. 50 відсотків сесій були збоченим NSFW, і сам автор есею до цих 50 відсотків приклав руку. Але OpenAI відмовились від легких грошей і перекрили кран, що приносив їм мільони.
Бо щоб ШІ став приносити мільярди, йому потрібна була база.
Я читав якось інтерв'ю, де в OpenAI розповідали, що їх технологія large language model completions була нікому не потрібна. Доки в GPT не з'явилась частина “Chat” — простий і зрозумілий інтерфейс. І понеслось. Їх чат з ШІ став основою для набагато складніших застосунків — наприклад, автоматичного керування промисловими системами кондиціювання приміщень.
А все почалось з того, що творцям дали міцну базу в вигляді інтерфейсу чату.
Тому тепер, OpenAI просто підняли рівень бази. З 6 листопада, база вже не просто чат з ШІ. Тепер це і зв'язок ШІ з зовнішніми API, і читання великих документів, і 128 тисяч токенів безпосереднього контексту, який ШІ може сприйняти.
Так, вони знищили ринок на кількасот мільйонів доларів ARR. Та не просто знищили, а випололи його, як бур’ян — щоб посадити насіння ринку на кількасот мільярдів.
А ті, хто будував стартапи на попередні хиткій базі — немов ті ластівки, що звили гніздо на біотуалеті для будівельників.
Сподіваюсь, вони встигли висидіти яйця.