"Изкуствен интелект" е модната дума за 2023 г., тъй като компаниите се надпреварват да търсят иновативни начини за използване на ИИ. Видяхме, че Microsoft пое инициативата с интегрирането на ChatGPT в Bing Chat. Това накара много лидери в областта на иновациите да се борят, за да защитят позицията си. Google реагира с пускането на Google Bard и интегрирането на ИИ в няколко от своите потребителски продукти, но изглежда, че компанията е подготвила още повече за това, което се надява да направи с ИИ под формата на Gemini.
Според доклад, публикуван от The Information, който се позовава на анонимен източник, Google работи по най-големия си проект за ИИ досега под формата на Gemini, който може да стартира още тази есен. Gemini е моделът на фонда за ИИ от следващо поколение на компанията, който се състои от група големи модели за машинно обучение.
С Gemini Google се надява да надмине конкуренцията, която се е фокусирала предимно върху една единствена среда за своите големи езикови модели. Той би могъл да комбинира възможностите за разговорни текстове с генериране на изображения с изкуствен интелект, което го прави подходящ за по-общи случаи на употреба.
По този начин Gemini ще може не само да генерира текст като ChatGPT, но и да създава контекстуални изображения и се надяваме дори да надхвърли това. В бъдеще той вероятно ще може да се използва за анализ на графики, създаване на графики с текстови описания и управление на софтуер с текстови или гласови команди.
Съобщава се също, че Google използва видеозаписи от YouTube за обучение на Gemini. Моделите, обучени на базата на видеоклипове от YouTube, могат да предоставят съвети въз основа на видеосъдържание, като например да помагат на механици да диагностицират проблем въз основа на видеоклипове за ремонт на автомобили. Използването на видеосъдържание от YouTube може също така да помогне на Google да разработи софтуер за преобразуване на текст във видео.
Юристите на компанията обаче следят внимателно материалите за обучение, за да се избегне обучение по материали, защитени с авторски права. В един от случаите адвокатите накараха изследователите да премахнат учебните данни от учебници поради опасения от отпор от страна на притежателите на авторски права.
Компанията би могла да интегрира Gemini в своя пакет от продукти и услуги, като например Bard, Google Docs и Slides. Можем да очакваме да видим някаква форма на издание за разработчици за Gemini преди края на годината, въпреки че компанията може да започне да го използва в някои потребителски продукти по-рано. Разработчиците могат да очакват достъп до Gemini на определени цени чрез платформата Google Cloud Platform.
За да постигне тези цели и да изпревари конкуренцията, Google съобщава, че е събрала няколко членове на своите екипи Google Brain и DeepMind, за да работят заедно по Gemini. Сред тях е и съоснователят на Google Сергей Брин, за когото се твърди, че ще играе важна роля в оценяването и обучението на моделите на Gemini.
Снимка: Unsplash