Привет, друзья! Добро пожаловать в очередной выпуск TechCrunch о прогрессе в мире искусственного интеллекта. Если вы хотите получать его каждую среду прямо в почтовый ящик, подпишитесь здесь.
Независимо от того, что вы думаете о генеративном ИИ, одно ясно как день: он стремительно превращается из научной игрушки в массовый товар. Google и OpenAI словно дали старт гонке цен, снизив стоимость своих базовых текстовых моделей. Google уменьшил входную цену для Gemini 1.5 Flash (обработка текста моделью) на 78%, а выходную (создание текста моделью) – на 71%. OpenAI пошел еще дальше, урезав входную цену для GPT-4o вдвое и выходную – на треть.
Дешевле, чем прогнозировали: логика за цифрами
Средняя стоимость логического вывода – то есть запуска модели – ежегодно падает на впечатляющие 86%! Что же заставляет этих гигантов искусственного интеллекта так активно снижать цены?
1. Отсутствие революционных отличий
“Мы ожидаем, что давление на ценообразование всех моделей с искусственным интеллектом сохранится, если не будет каких-либо уникальных преимуществ”, – уверен Энди Турай, главный аналитик Constellation Research. “Если потребление не растет или конкуренция усиливается, все поставщики должны быть агрессивными в отношении цен, чтобы удержать клиентов”.
2. Коммерциализация и конкуренция
Джон Лавлок, вице-президент по аналитике Gartner, согласен: коммерциализация и борьба за рынок – главные движущие силы снижения цен. Раньше модели оценивались по принципу “затраты плюс стоимость” – окупая миллиардные инвестиции в их обучение (OpenAI GPT-4, например, обошелся якобы в 78,4 миллиона долларов) и расходы на серверы (ChatGPT в какой-то момент обходился OpenAI в ~ $700 000 в день). Теперь же центры обработки данных достигли таких масштабов, что могут предложить скидки.
3. Оптимизация работы: кэширование и пакетная обработка
Поставщики, включая Google, Anthropic и OpenAI, применяют хитрости вроде оперативного кэширования и пакетной обработки для дополнительной экономии. Кэширование подсказок позволяет разработчикам сохранять определенные “контексты запросов”, которые можно повторно использовать при обращении к модели через API, а пакетная обработка обрабатывает асинхронные группы некритичных (и, следовательно, более дешевых) запросов на вывод модели.
4. Открытые модели как конкурент
Появление крупных открытых моделей, таких как Llama 3 от Meta, также оказывает давление на ценообразование. Хотя самые мощные из них все еще дороги в эксплуатации, они могут конкурировать с предложениями поставщиков по стоимости, если запускать их на собственной инфраструктуре предприятия.
Устойчивость снижения цен: вопрос открытый
Но будет ли этот тренд на дешевизну продолжать развиваться? Производители ИИ теряют деньги – говорят, что OpenAI в этом году потеряет 5 миллиардов долларов, а Anthropic прогнозирует убытки свыше 2,7 миллиарда к 2025 году.
Лавлок считает, что высокие капитальные и эксплуатационные расходы могут заставить поставщиков пересмотреть ценообразование кардинально:
“Учитывая, что создание моделей следующего поколения оценивается в сотни миллионов долларов, к чему приведет “затраты плюс стоимость” для потребителя?” – задается он вопросом.
Ответ мы получим в ближайшем будущем.
Новости недели: ИИ набирает обороты
* **Маск поддерживает безопасность ИИ:** Илон Маск выступил за калифорнийский закон SB 1047, который обязывает производителей крупных моделей ИИ предусматривать меры предосторожности против потенциального вреда.
* **Хинди под колпаком: обзоры с ИИ не без ошибок:** Иван отмечает, что хинди-язычные обзоры Google с использованием ИИ содержат ляпы, например, предлагают “липкие вещи” в качестве летней закуски.
* **Водяные знаки от OpenAI:** OpenAI, Adobe и Microsoft поддержали калифорнийский законопроект о маркировке контента, созданного ИИ. Голосование состоится в августе.
* **Inflection ограничивает доступ к чат-боту Pi:** Стартап Inflection, где большая часть команды ранее работала в Microsoft, перенаправляет фокус на корпоративные продукты и ограничит бесплатный доступ к своему чат-боту Pi.
* **Вольфрам о новом золотом веке философии:** Стивен Вольфрам, основатель Wolfram Alpha, считает, что ИИ открывает новый этап для философии из-за новых вопросов, которые он поднимает.
* **Waymo и дети на самокатах?:** Waymo рассматривает подписку для подростков, позволяющую им арендовать автомобили с вождением от Waymo и оповещать родителей о местоположении ребенка.
* **Протест в DeepMind:** Сотрудники DeepMind (подразделение Google по ИИ) недовольны оборонными контрактами Google и выразили это в обращении.
* **Стартапы с ИИ: охота на SVP:** Венчурные инвесторы все чаще покупают акции поздних стартапов в сфере ИИ на вторичном рынке, используя финансовые инструменты типа SVP (Specialized Vehicles), чтобы получить долю в лидерах отрасли.Модель недели: Anthropic и “Артефакты”
На этой неделе Anthropic выпустила функцию “Артефакты” для всех пользователей, превращая взаимодействие с моделями Claude в полноценные приложения, графику, информационные панели, веб-сайты и многое другое.
Теперь пользователи могут публиковать и редактировать свои артефакты, созданные с помощью Claude, обмениваться ими в открытом пространстве или в закрытой среде для подписчиков платных планов Anthropic. Это похоже на функцию Previews в Poe, но в отличие от нее, Artifacts доступны бесплатно.
“Клубничка” OpenAI: новый уровень ИИ?
Слухи о новой модели OpenAI, возможно, с кодовым названием “Strawberry”, набирают обороты. Говорят, она способна решать сложные математические задачи, программирования и даже словесные головоломки типа “Связей” из New York Times лучше, чем существующие модели. Единственный недостаток – более длительное время “обдумывания”.
OpenAI планирует запустить Strawberry осенью, возможно, на платформе ChatGPT. Также предполагается использование ее для генерации синтетических данных для обучения будущих моделей, включая следующую крупную модель под кодовым названием Orion.