Что такое MosaicML и почему Databricks покупает его за 1,3 миллиарда долларов?
На прошлой неделе компания Databricks потрясла мир больших данных, объявив о планах по приобретению MosaicML за 1,3 миллиарда долларов. При выручке всего в 1 миллион долларов на конец 2022 года и 20 миллионов долларов в этом году некоторые предположили, что Databricks сильно переплатила. Но, по словам генерального директора Databricks Али Годси, покупка MosaicML станет отличной сделкой, которая принесет пользу его компании и ее клиентам.
MosaicML — это стартап в области генеративного ИИ, соучредителем которого в начале 2021 года является Навин Рао, уважаемый руководитель в области технологий, который также был основателем Nervana Systems, стартапа по разработке программного обеспечения для глубокого обучения, который Intel купила в 2016 году за 400 миллионов долларов.
Цель MosaicML довольно проста: она хочет упростить генеративный ИИ и донести его до большего числа людей. С этой целью MosaicML разработала собственную платформу, которая позволяет клиентам обучать свою собственную большую языковую модель (LLM) на своих собственных данных и запускать ее где угодно.
Вместо того, чтобы заставлять пользователей становиться экспертами в области ИИ, которые могут обучать, настраивать, развертывать, масштабировать и контролировать этот новый тип продукта ИИ, MosaicML обрабатывает эти мельчайшие детали для своих клиентов. Пользователи могут выбрать любой из доступных LLM с открытым исходным кодом. В качестве альтернативы они могут использовать LLM компании, в том числе MPT-7B, LLM с открытым исходным кодом на 7 миллиардов параметров, или недавно выпущенный MPT-30B, LLM на 30 миллиардов параметров. Он также имеет доступ к графическим процессорам, которые в наши дни в большом почете.
Время MosaicML не может быть лучше. В то время как сообщество искусственного интеллекта и машинного обучения знало о новых возможностях LLM, построенных на новаторской архитектуре Transformer от Google, в течение последних нескольких лет, мир в целом узнал об этих разработках только около восьми месяцев назад. 30 ноября, день, когда OpenAI выпустила ChatGPT для всего мира.
(lokesh264/Shutterstock)
Хотя ChatGPT творит чудеса, привлекая внимание к прогрессу в области ИИ, не все в восторге от новой бизнес-модели (некоторые также боятся того, что ИИ сделает с обществом, но это уже другая история). ). Многие компании будут рады использовать возможности предварительно обученных моделей GPT OpenAI через свой API, но многие другие категорически против отправки личных данных по сети в OpenAI, не говоря уже о Google или Microsoft, которые сотрудничают с OpenAI и глубокая интеграция LLM в свой набор продуктов.
И в этом заключается первая важная причина, по которой MosaicML попал в поле зрения Databricks: MosaicML позволяет компаниям создавать свои собственные LLM, сохраняя конфиденциальность своих данных.
«За последние шесть-семь месяцев каждое крупное предприятие, с которым мы разговаривали, я думаю, что каждая встреча, которую я провел с клиентом, всегда заканчивалась переходом к генеративному ИИ», — сказал Годси на прошлой пресс-конференции. неделя. «Каждый разговор, даже если речь идет о чем-то другом, в конце концов ведет к генеративному ИИ.
«И первое, о чем все говорят, это то, что мы хотим владеть нашей собственной интеллектуальной собственностью, мы хотим создавать свои собственные модели машинного обучения, и мы хотим иметь возможность конкурировать на моем рынке, на котором я работаю», он продолжил.
Когда руководители Databricks спрашивали, какие компании используют для создания собственных LLM, одно имя постоянно всплывало. «И имя, которое мы постоянно слышали на собраниях, было MosaicML, MosaicML, Naveen at Mosaic», — сказал Годси.
Компания Databricks обратилась к MosaicML с предложением установить «тесное партнерство». Но по ходу переговоров вскоре возник барьер.
«Мы поняли, что если мы действительно хотим, чтобы все было гладко, если мы хотим помочь клиентам создать свой собственный [LLM], сохранить конфиденциальность своих данных, снизить стоимость и сделать это действительно рентабельным, чтобы сделать это самостоятельно, дешево, лучший способ — объединить усилия», — сказал Годси.
Навин Рао, соучредитель и генеральный директор MosaicML, выступает на саммите Databricks Data + AI Summit 2023
Интеграция между Databricks и MosaicML еще не началась — свое слово в приобретении получат регулирующие органы. Как только это произойдет, Годси убежден, что получившаяся платформа позволит клиентам выпускать приложения для генеративного ИИ гораздо быстрее, чем при использовании альтернативных методов.
«Сегодня их очень и очень сложно построить, — сказал он. «Очень немногие компании, очень немногие исследователи могут это сделать. Это магическое искусство. Вы должны знать, как сделать все правильно. И Mosiac просто работает из коробки. На самом деле мы попробовали это, пока проводили комплексную проверку. Вы устанавливаете некоторые параметры, и он просто работает из коробки. У них есть графические процессоры, и вы получаете модель, которой вы можете владеть как своим собственным IP на своих собственных данных. Так что это идеально».
Всего за несколько лет Databricks превратилась из хранителя Apache Spark в одну из ведущих платформ для ИИ. Он уже привлек 10 000 платных клиентов, которые могут использовать решения Databricks для хранения данных, аналитики SQL, машинного обучения и потоковой передачи данных. Приобретение MosaicML добавит генеративный ИИ в список того, что клиенты могут делать со своими данными в Delta Lake.
Это не первый опыт Databricks в области генеративного ИИ. Ранее в этом году, на фоне ажиотажа вокруг ChatGPT, компания запустила Dolly, LLM с 6 миллиардами параметров, с открытым исходным кодом, которую клиенты могут использовать для создания собственных генеративных приложений ИИ. За этим последовала в апреле Dolly 2, модель с 12 миллиардами параметров, которая также была построена на EleutherAI
. В то время как технологические гиганты сосредотачиваются на массивных собственных LLM, которые содержат сотни миллиардов параметров и обучаются на огромных треках разнообразных собранных данных. из общедоступного Интернета Databricks поддержала преимущества использования небольших моделей с открытым исходным кодом, обученных на гораздо более целевых наборах данных.
«Вы можете получить что-то пригодное для использования за 1000 долларов, а если вы дойдете до 1 миллиона долларов, вы можете получить что-то очень высокого качества, чрезвычайно высокого качества», — сказал Годси. «Это далеко от того, о чем говорит пресса… когда они говорят о том, что OpenAI тратит миллиарды долларов, или Google DeepMind тратит миллиарды, а они есть. Но мы не говорим ни о чем подобном, чтобы иметь возможность создавать очень ценные, очень хорошие модели машинного обучения, которые могут принести пользу этим организациям».
Рао, который в 2017 году был Datanami Person to Watch, также обсудил предстоящее приобретение во время основного выступления на прошлой неделе на саммите Databricks Data + AI. В частности, он рассказал о том, как люди, стоящие за Replit, которая разрабатывает браузерную IDE для программного обеспечения ИИ, использовали MosaicML и Databricks для создания новых инструментов.
По словам Рао, Replit потребовалось всего три дня, чтобы получить рабочий прототип после подключения своих данных, размещенных в Databricks.«Получилось с первой попытки. Это удивительно. Нам нравятся такие варианты использования», — сказал Рао. «На самом деле с самого начала мы сосредоточились на соблюдении конфиденциальности данных. Мы считаем, что это критически важно для масштабирования генеративных возможностей ИИ и их демократизации. Если у вас на самом деле нет технологий, которые могут обеспечить конфиденциальность данных, вы в конечном итоге получите несогласованные стимулы на рынке. Поэтому очень важно дать людям возможность создавать решения на основе их уникальных данных, создавая собственную интеллектуальную собственность».
MosaicML масштабируется, чтобы справиться с этим безумием генеративного ИИ. Компания, собравшая 37 миллионов долларов, наняла более 60 сотрудников, стремясь развивать бизнес. Годси сказал, что команда MosaicML имеет ту же ДНК, что и Databricks, что упростит интеграцию двух компаний.
Databricks покупает MosaicML не для получения доступа к своим LLM. Как заметил Годси, LLM придут и уйдут. Там будут тысячи на выбор. Вместо этого MosaicML понравился ему и исполнительной команде Databricks из-за его способности помогать пользователям создавать свои собственные LLM и приложения для генеративного ИИ.
«Я покупаю фабрику, которая может создать это», — сказал он. «Я не покупаю Tesla Model X. Если у Tesla Model X какая-то неисправность или что-то в этом роде, ничего страшного. Я покупаю завод, который может производить эти автомобили Tesla и может производить их все больше и больше вместе».
Но есть еще одна вещь, которая помогла заключить сделку. «Я бы также сказал, что у них есть доступ ко многим графическим процессорам», — сказал Годси. «Это приятная вишенка на торте из-за нехватки графических процессоров прямо сейчас».
Связанные элементы:
Databricks выпускает новые инструменты для Gen AI в Lakehouse Искусственный интеллект
Технологии: Облако, ПО промежуточного слоя
Поставщики: Databricks, MosaicML
Метки: Али Годси, большие данные, ChatGPT, генеративный ИИ, магистр права, машинное обучение, Навин Рао
Коды активации Garena Free Fire на 8 июля 2023 г.
: редкие наборы, крутые скины и многое другоеДомой Как использовать Garena Free Fire Коды активации на 8 июля 2023 г.: редкие наборы, крутые скины и многое другое
Коды погашения Garena Free Fire на 8 июля: не пропустите сегодня потрясающие награды. Проверьте, как запросить эти коды погашения.
Коды погашения Garena Free Fire на 8 июля: узнайте, как получить интересные награды. (ff.garena.com)Использовать коды на 8 июля
Есть несколько правил, которые вы должны запомнить, прежде чем начнете получать свои награды. Эти коды погашения представляют собой 12-значные уникальные буквенно-цифровые коды, которые содержат специальные внутриигровые предметы. Награды варьируются от костюмов, оружия, аксессуаров и ваучеров на бриллианты до премиальных наборов. Чтобы запросить коды, вам нужно будет зайти на веб-сайт погашения и отправить их. Эти коды публикуются ежедневно, так что вы можете попытать счастья снова и снова. Количество кодов, которые вы можете получить, не ограничено, но один код может быть использован игроком только один раз.
Но убедитесь, что вы соблюдаете эти два основных условия при обналичивании приза. Во-первых, коды приходят со сроком действия 12-18 часов. Поэтому обязательно заберите их, как только сможете. А некоторые коды могут быть ограничены определенными регионами, поэтому для них они работать не будут. Вот почему сосредоточьтесь на получении как можно большего количества кодов.
Примечание: Игра запрещена в Индии, но игроки за пределами страны могут использовать эти коды, чтобы получить потрясающие бесплатные подарки. Проверьте коды ниже.
- 3IBBMSL7AK8G
- 8F3QZKNTLWBZ
- WEYVGQC3CT8Q
- GCNVA2PDRGRZ
- J3ZKQ57Z2P2P 9010 0
- FFICJGW9NKYT
- XUW3FNK7AV8N
- B3G7A22TWDR7X
- FF7MUY4ME6SC
- 4ST1ZTBE2RP9
- X99TK5 6XDJ4X
- FFCMCPSJ99S3
- MCPW3D28VZD6
- ZZZ76NT3PDSH
- XZJZE25WEFJJ
- V427K98RUCHZ
- B3G7A22TWDR7X
- 6KWMFJVMQQYG
- 3IBBMSL7AK8G
- J3ZKQ57Z2P2P
- GCNVA2PDRGRZ
- 4ST1ZTBE2RP9
- FFCMCPSUYUY7E
- EYh3W3XK8UPG
- UVX9PYZV54AC
Коды погашения Garena Free Fire на 8 июля: Как получить бесплатные награды
Шаг 1: Посетите официальный сайт страницы погашения Garena Free Fire на https://reward.