Machine Learning: Нейросети и машинное обучение
Podkast haqida
Подкаст «Machine Learning» – это захватывающее путешествие в мир нейросетей, машинного обучения и искусственного интеллекта, созданное для всех, кто хочет разобраться в технологиях, меняющих мир! Каждую неделю мы погружаемся в актуальные темы: от новейших архитектур нейросетей, таких как трансформеры, до применения ИИ в медицине, финансах, играх и творчестве. Вместе с ведущими экспертами, исследователями и практиками мы обсуждаем, как алгоритмы учатся, почему большие языковые модели вроде GPT революционизируют обработку данных, и какие этические дилеммы стоят за развитием ИИ.
Наши эпизоды – это не только глубокий разбор сложных концепций простым языком, но и реальные кейсы, вдохновляющие истории и прогнозы о будущем технологий. Хотите узнать, как обучить модель, избежать ловушек переобучения или интегрировать ИИ в свой проект? А может, вас волнует, заменят ли нейросети программистов или как обезопасить данные? Мы отвечаем на эти вопросы, делимся полезными инструментами, библиотеками и лайфхаками для разработчиков и энтузиастов.
"MachineLearning" – это место, где сложное становится понятным, а технологии – доступными. Слушайте нас, чтобы оставаться на волне инноваций, вдохновляться идеями и, возможно, найти свою нишу в мире ИИ! Подписывайтесь и присоединяйтесь к сообществу, где мы вместе исследуем, как нейросети формируют наше будущее. #ИИ #МашинноеОбучение #Нейросети #Технологии #Инновации
Janrlar va teglar
LAION и Intel создали инструмент для анализа 40 эмоций по мимике и голосу.
Совместный проект «Empathic Insight» - это набор моделей и датасетов для распознавания эмоций. Система оценивает интенсивность 40 эмоций на изображениях или аудиозаписях, используя шкалу от 0 до 7 для лиц и градации «отсутствие/слабо/сильно» для голоса. В основе - модели EmoNet, которые оперируют вероятностями и построенные на расширенной эмоциональной таксономии.
Для обучения использовали 203 тыс. синтетических лиц и 4,7 тыс. аудиозаписей, включая данные из датасета Laion’s Got Talent (5 тыс. часов речи на нескольких языках). EmoNet обешел Gemini 2.5 Pro и Hume AI в точности соответствия оценкам психологов.
Попутно разработана BUD-E Whisper - файнтюн Whisper, добавляющая анализ эмоций, возраста и пола в транскрибацию. Модели доступны на Hugging Face под лицензиями CC и Apache 2.0.
Deezer объявил о маркировке треков, созданных ИИ.
Музыкальная платформа начала предупреждать пользователей об альбомах с песнями, полностью сгенерированными ИИ. Это часть усилий против мошенников, которые используют ИИ для накрутки прослушиваний и получения необоснованных роялти. По данным компании, 18% ежедневно загружаемых треков (около 20 тысяч в день) создаются с помощью генераторов музыки.
Платформа признает, что полностью ИИ-музыка составляет лишь 0.5% трафика, но рост показателя указывает на системную уязвимость. В условиях споров вокруг обучения ИИ на чужих данных и отсутствия четкого регулирования, инициатива Deezer может стать прецедентом для отрасли.
Foxconn и NVIDIA внедряют гуманоидов в производство.
Компании договорились использовать гуманоидных роботов на новом заводе в Хьюстоне, где будут выпускать серверы GB300 для ИИ. Это станет первым случаем применения человекоподобных роботов в производстве продукции NVIDIA. Работа начнётся в первом квартале 2025 года, а роботы займутся сборкой, вставкой кабелей и перемещением компонентов.
Завод выбран не случайно: свободное пространство позволяет адаптировать линии под новых «работников». Пока неизвестно, какие именно гуманоиды будут задействованы — собственные разработки Foxconn с NVIDIA или китайские модели от UBTech.
Surglasses анонсировала первый в мире анатомический стол с интегрированным ИИ.
Asclepius AI Table - первый в мире анатомический стол с искусственным интеллектом, который меняет подход к обучению в медицине и ветеринарии. Устройство работает без дополнительного ПО, объединяя 8 модулей для изучения анатомии, патологии и биомеханики.
Встроенные ИИ-инструкторы отвечают на голосовые и текстовые запросы в реальном времени, объясняя структуры тела и адаптируя уроки под уровень ученика. Студенты могут исследовать 3D-модели тела, реконструировать КТ-снимки или анализировать гистологические слайды. Для ветеринаров доступна библиотека анатомий разных видов животных.
Отдельно выделен модуль кинезиологии с анимациями движений суставов и мышц, а также симулятор УЗИ с клиническими данными. Устройство уже заинтересовало вузы и клиники по всему миру.
Helm.ai представил камерную систему для автономного вождения автомобилей.
Honda и стартап Helm.ai анонсировали систему Helm.ai Vision, решение для автономного вождения, основанное исключительно на камерах. Технология будет внедрена в электромобили Honda 2026 года, позволяя водителям не держать руки на руле и глаза на дороге.
В отличие от компаний, использующих лидар, Helm.ai делает ставку на «компьютерное зрение»: камеры строят карту окружения в реальном времени, создавая вид сверху для улучшения навигации. Система совместима с чипами Nvidia и Qualcomm, что упрощает интеграцию в существующие платформы. Продукт будет предлагаться рынку по модели лицензирования ПО для автопроизводителей.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
OpenAI прекращает сотрудничество со Scale AI.
OpenAI объявила, что больше не будет работать с Scale AI, стартапом, специализирующимся на разметке данных. Решение принято после того, как компания Марка Цукерберга инвестировала $14,3 млрд в Scale и переманила ее основателя Александра Ванга для создания «суперинтеллекта».
В OpenAI заявили, что Scale AI обеспечивал лишь небольшую часть их потребностей, а из-за роста сложности моделей требуются более квалифицированные партнеры. Теперь компания переключается на других поставщиков, Mercor, который раньше занимался рекрутингом, а теперь помогает в создании ИИ.
Для Scale AI это довольно ощутимый удар: потеря одного из ключевых клиентов и уход лидера всего за одну неделю.
Midjourney открыла доступ к своей видео-модели.
После недель анонсов и сбора фидбэка, Midjourney представила свою первую Image-to-Video модель. Новая функция Animate позволяет превращать любые картинки в короткие анимационные ролики через автоматический или ручной режим. Режимы Low Motion и High Motion регулируют интенсивность движения. Видео можно продлевать до 16 секунд, добавляя описания к каждому фрагменту. Поддерживаются и сторонние изображения: их загружают как стартовый кадр, а движение задают текстовым промптом.
Ролики пока доступны в 480p при 24 кадрах в секунду. Генерация стоит в 8 раз больше, чем изображения, но компания утверждает, что это в 25 раз дешевле конкурентов. Для Pro-подписчиков тестируют Video Relax Mode, экономящий приоритетные минуты. По словам создателей, видео - это промежуточный этап перед объединением 3D, видео и реального времени в единой платформе.
SandboxAQ опубликовала в открытый доступ датасет трехмерных ко-структур молекул белков и препаратов.
Компания SandboxAQ, выделенная из Google и поддержанная Nvidia, опубликовала массив данных, цель которого помочь ученым прогнозировать, как молекулы веществ взаимодействуют с целевыми белками в организме. Это критически важно на ранних этапах создания препаратов: если молекула не «прилипает» к нужному белку, лекарство не сработает.
Используя чипы Nvidia, компания сгенерировала 5,2 млн «синтетических» молекул — теоретических структур, основанных на реальных данных. Эти данные обучают ИИ-модели, которые за минуты вычисляют вероятность связывания, экономя месяцы ручных расчетов.
Исследование MIT: ChatGPT снижает активность мозга у его пользователей.
Ученые из MIT провели эксперимент с 54 добровольцами, которые писали эссе, используя ChatGPT, Google или только свои знания. EEG-анализ показал: у участников с ChatGPT активность мозга была на 30% ниже, особенно в зонах, отвечающих за креативность и память. Со временем они начинали копировать ответы ИИ, теряя навыки формулирования идей. Зато группа без подсказок демонстрировала высокую нейронную связность — мозг работал активнее, генерируя идеи.
Автор исследования, Наталия Космина, предупреждает: чрезмерное доверие к ИИ угрожает обучению и критическому мышлению, особенно у детей. Она призналась, что вставила «ловушки» в текст статьи, чтобы проверить ИИ-суммаризаторы: те начали придумывать версии ChatGPT, которых не было в данных.
Следующий этап - изучение влияния ИИ на программирование. Первые результаты нового этапа, по словам авторов, пугают еще больше.
Baidu провела стрим с цифровыми аватарами.
Baidu провела стрим, который может изменить будущее e-commerce, представив цифрового клона известного в Китае стримера Ло Юнхао на своей платформе, поддерживаемого моделью ERNIE. Это мероприятие стало первым в своем роде, где два цифровых аватара вели лайв-стрим одновременно.
Они привлекли более 13 миллионов просмотров за 6 часов и сгенерировали продаж товаров потребительской электроники на сумму более 55 миллионов юаней (7,6 млн. долл). Технология ERNIE позволила аватарам не только общаться в реальном времени, но и генерировать описания продуктов объемом более 97 тысяч символов.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Генерация изображений ChatGPT теперь доступна в WhatsApp.
OpenAI запустила функцию создания изображений по текстовым запросам в WhatsApp через бота 1-800-ChatGPT. Ранее возможность генерировать картинки была доступна только в мобильном приложении и на сайте сервиса.
Владельцы платных аккаунтов ChatGPT получают дополнительные преимущества. Привязав подписку к WhatsApp, они увеличивают лимиты на генерацию. Данных о геодоступности интеграции и объема, на который увеличиваются лимиты, OpenAI не предоставила.
Google Gemini 2.5: Pro и Flash доступны всем, Flash-Lite в превью.
Google официально представила стабильные версии Gemini 2.5 Pro и Flash, обещая улучшенную производительность при оптимальных затратах и скорости. Эти модели уже готовы к использованию в промышленных приложениях.
Параллельно анонсирована пробная версия Flash-Lite — самая дешевая и быстрая из линейки. Она показывает лучшие результаты, чем Gemini 2.0, в программировании, математике и обработке данных. Модель поддерживает работу с инструментами (поиск, исполнение кода) и обрабатывает до 1 млн. токенов за раз.
Доступ к Flash-Lite открыт через AI Studio и Vertex AI, а Pro и Flash в мобильном приложении Gemini.
Adobe Firefly стала доступна на мобильных устройствах.
Adobe выпустила мобильное приложение Firefly для iOS и Android. Инструмент объединяет собственные модели Adobe и сторонние решения от OpenAI, Google (Imagen 3/4, Veo 2/3), Flux и других. Пользователи получают доступ к функциям Generative Fill, текстового генератора видео и улучшения изображений.
Приложения получили синхронизацию с Creative Cloud, а для использования некоторых ИИ-опций требуются генеративные кредиты. Подписчики Creative Cloud могут использовать Firefly бесплатно, но отдельные функции доступны по специальной подписке.
Обновленная платформа Firefly Boards, напоминающая FigJam, теперь поддерживает редактирование и создание видео на основе моделей Google и Adobe.
Cursor добавил новый тарифный план Ultra за $200 в месяц.
Ultra, новый тариф, с объемом вычислений в 20 раз больше, чем у Pro стал возможен благодаря партнерству с OpenAI, Anthropic, Google и xAI. Эти компании обеспечили доступ к мощным вычислительным ресурсам.
Параллельно обновлен Pro-тариф: теперь он предлагает неограниченное использование с ограничениями по скорости, а лимиты на вызовы инструментов полностью сняты. Сохранение прежнего лимита в 500 запросов в день можно выбрать вручную.
Groq появился в Hugging Face Hub как поставщик инференса.
Groq стал доступен для запуска моделей на Hugging Face Hub, платформа добавила компанию в число своих поставщиков вычислений. Groq предлагает рекордно низкие задержки благодаря собственным процессорам обработки языка, которые заменяют традиционные GPU. Поддерживаемые модели включают свежие открытые версии Llama 4 и Qwen QWQ-32B, полный список можно посмотреть тут.
Интеграция работает через веб-интерфейс и клиентский SDK, а оплата возможна двумя способами: через API-ключ Groq или через Hugging Face без наценок. Для бесплатных аккаунтов доступен ограниченный объем инференса, а PRO-пользователи получают $2 ежемесячного кредита.
Reddit запустил рекламные инструмента на основе ИИ.
Основной фишкой стал «Reddit Insights powered by Community Intelligence», он в реальном времени отслеживает тренды и помогает тестирует идеи для кампаний. Еще один инструмент, «Conversation Summary Add-ons», позволяет брендам добавлять под рекламу позитивные комментарии пользователей о продукте.
Reddit, похоже, угадывает с трендом: автоматизация и аналитика становятся ключевыми в условиях жесткой конкуренции за внимание.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Google запускает функцию Audio Overviews в поиске.
Google объявила о запуске экспериментальной функции Audio Overviews, которая генерирует аудио-сводки для поисковых запросов. Новинка основана на новых моделях Gemini и направлена на упрощение восприятия информации для пользователей, предпочитающих аудиоформат. Функция пока доступна в программе Labs, ее активируют автоматически, если система считает, что обзор будет полезен.
К аудио Google добавит ссылки на источники, чтобы слушатели могли углубиться в тему. Пользователи могут оценивать обзоры, отправляя обратную связь через кнопки «нравится»/«не нравится».
Технические гении из Кремниевой долины идут в армию для внедрения ИИ в военные операции.
ВС США создали отряд резервистов "201", куда вошли топ-менеджеры Palantir (Шьям Санкар, CTO) , Компании Марка Цукерберга (Эндрю Босворт, СТО) и OpenAI (Кевин Вейл и Боб Макгрю). Все "новобранцы" получили звания подполковников, их задача - внедрять ИИ в планирование и операции армии и ускорять трансформацию подразделений.
Эксперты будут работать удаленно, минимум 120 часов в год, не проходя базовой подготовки. Palantir уже сотрудничает с армией с 2008 года (проект Maven, $480 млн) по интеграции ИИ. IT-гигант Цукерберга, в свою очередь, связан с Anduril, поставляющей «умные» очки. OpenAI, несмотря на прошлые обещания не разрабатывать военные продукты, также участвует в партнерствах с военными.
Нью-Йорк принимает закон о безопасности ИИ.
Законодатели Нью-Йорка одобрили RAISE Act, направленный на предотвращение масштабных катастроф, вызванных передовыми ИИ-моделями от компаний OpenAI, Google и Anthropic. Закон требует публиковать отчеты о безопасности, сообщать об инцидентах и грозит штрафами до $30 млн. Регулирование коснется лишь крупных игроков, потративших свыше $100 млн на вычисления.
Авторы закона подчеркнули, что он не должен тормозить стартапы или научные исследования, в отличие от провалившегося законопроекта SB 1047 в Калифорнии. Однако критики, включая Andreessen Horowitz и Anthropic, утверждают: требования слишком широки и могут ударить по малым компаниям.
В настоящее время RAISE Act ждет подписи губернатора штата.
Topaz Labs анонсировала веб-инструмент Astra для апскейлинга видео до 4K.
Astra — веб-сервис для улучшения качества видео, который масштабирует контент до 4K, сохраняя детали. Инструмент подойдет как для творческих экспериментов, так и для точного восстановления кадров: пользователи могут регулировать интенсивность обработки или фокусироваться на резкости.
Astra поддерживает до 120 кадров в секунду и замедление в 8 раз с плавной интерполяцией кадров. Topaz Labs позиционирует Astra как полезный инструмент для ремастеринга старых записей или улучшения медийных проектов.
Открыта запись в лист ожидания доступа к сервису.
TikTok запустил 3 новых инструмента для автоматической генерации видео для рекламы.
«Image to Video» превращает статичные изображения в пятисекундные клипы. Рекламодатели загружают изображение, добавляют текстовый запрос и получают несколько вариантов видео, которые можно комбинировать в более длинные ролики.
«Text to Video» позволяет генерировать видео только на основе текста, без изображений или шаблонов. Третий инструмент, «Showcase Products», добавляет цифровые аватары, которые держат продукты, примеряют одежду или показывают приложения на смартфоне, делая рекламу более живой и похожей на пользовательский контент.
Все видео помечаются как сгенерированные ИИ и могут интегрироваться в Adobe Express и WPP Open. TikTok не раскрывает, какие именно модели используются.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Google DeepMind запустила Weather Lab с ИИ для прогнозирования циклонов.
Weather Lab - это сервис, где Google DeepMind тестирует экспериментальные модели ИИ для прогноза тропических циклонов. Инструмент генерирует 50 сценариев развития стихии за 15 дней, используя стохастические нейросети.
Традиционные физические модели часто жертвуют точностью интенсивности ради прогноза траектории, но ИИ-система DeepMind совмещает оба параметра. В тестах ее предсказания на 5 дней в среднем ближе к реальным координатам циклона на 140 км по сравнению с ведущими глобальными решениями. Также модель превосходит региональные физические аналоги в оценке силы урагана и радиуса ветров.
Новый метод ICM позволяет ИИ обучаться без человеческого контроля.
Исследователи из Anthropic, Университетов Нью-Йорка и Джорджа Вашингтона разработали метод Internal Coherence Maximization (ICM), который учит языковые модели работать с задачами, опираясь на собственную логику. Модель сама проверяет, насколько ответы согласуются между собой (взаимная предсказуемость) и нет ли противоречий (логическая непротиворечивость).
На тестах (TruthfulQA, GSM8K, Alpaca) ICM показал результаты, сравнимые с обучением на человеческих оценках, а в задачах на «субъективные» критерии даже превзошел их. Например, модель без специальной тренировки определила пол автора текста с точностью 80% — выше, чем у людей. Даже при обучении чат-бота Claude 3.5 Haiku через ICM система выигрывала в 60% случаев против версии с человеческим контролем.
Однако метод не всесилен: он работает только с теми понятиями, которые модель уже «знает», и терпит неудачу с длинными текстами или задачами, требующими новых знаний.
NVIDIA и Stability AI оптимизировали Stable Diffusion 3.5 с помощью TensorRT.
Совместная работа NVIDIA и Stability AI позволила ускорить генерацию в Stable Diffusion 3.5 и сократить использование видеопамяти. Модель Large, ранее требовавшая 18 ГБ VRAM, теперь работает с 11 ГБ благодаря FP8-квантованию, что делает ее доступной для большего числа GPU. На RTX 40-й серии и Blackwell-чипах FP8 и FP4 показали двукратный прирост производительности по сравнению с PyTorch.
TensorRT оптимизировал граф модели и веса под Tensor Cores, ускорив SD3.5 Large на 2,3x и Medium — на 1,7x. Разработчики также получили облегченный SDK (в 8 раз меньше) с JIT-компиляцией, позволяющий строить движки «на лету» через Windows ML. Оптимизированные версии уже доступны на Hugging Face, а в июле появится NIM-микросервис для упрощения интеграции в приложения.
Google добавила новые функции Gemini AI для Workspace.
Google расширила возможности Gemini AI в Workspace, добавив функции для анализа PDF и Google-форм. Система автоматически создает краткие сводки при открытии PDF, предлагая действия «составить предложение» или «сгенерировать вопросы ». Эти подсказки появляются в боковой панели и работают на 20+ языках с 12 июня.
Для Google-форм ИИ теперь подводит итоги ответов на открытые вопросы, выделяя ключевые темы. Эта опция активируется при трех и более ответах и станет доступна с 26 июня, но пока только на английском. Еще одна новинка, которую видят пользователи с 7 июля — «помоги создать форму», позволяющая генерировать шаблоны на основе описаний и прикреплённых файлов (Docs, Sheets и т.д.).
Китайские инженеры учат ИИ за границей, обходя санкции США.
Четверо китайских инженеров прилетели в Малайзию с чемоданами, набитыми жесткими дисками: 80 терабайт данных для обучения ИИ. В местном дата-центре их компания арендовала 300 серверов с чипами Nvidia, запрещенными к экспорту в Китай. Подобные схемы — ответ на давление США, ограничивающее поставки технологий.
Физическая доставка данных вместо медленной передачи через интернет, создание подставных компаний в Малайзии и переадресация оборудования через третьи страны — так китайские фирмы обходят контроль. Но санкции сжимаются: Nvidia усиливает проверки, а страны ЮВА ужесточают правила.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
В Пекине запустят первый в мире 4S-центр для роботов с воплощенным ИИ.
По аналогии с автосалонами, робототехнический 4S будет предлагать полный цикл: продажи (Sales), сервис (Service), запчасти (Spare parts) и консультации/анализ (Surveys). Планируется зона с демонстрацией роботов в реалистичных сценариях – можно будет всё пощупать руками и увидеть их возможности в деле. Плюс создадут быструю сеть поставки комплектующих по стране и соберут профильную команду для сборки, ремонта и обслуживания машин.
Первыми партнерами станут несколько лидеров сферы: UBTECH и Galaxea. Откроется центр в августе на базе промпарка в районе Ичжуан на юге столицы.
Браузер Dia выходит в бета-версию.
The Browser Company открыл доступ к бета-версии браузера Dia (по инвайтам). Dia позиционируется как решение, где ИИ глубоко интегрирован в самую суть взаимодействия, он встроен прямо в рабочий процесс пользователя, избавляя от необходимости постоянно ходить на сайты ChatGPT или Claude.
Dia построен на Chromium, так что интерфейс многим знаком. Главная фича — умная адресная строка: она работает и как поиск, и как чат-бот с ИИ. Помощник умеет искать в сети, суммировать загруженные файлы, автоматически переключаться между режимами. Можно даже спросить его о содержимом всех открытых вкладок или попросить составить черновик на их основе.
Настройки производятся через диалог с ботом: можно задать тон, стиль письма, параметры для кода. Опция History (по желанию) позволяет браузеру использовать недельную историю просмотров как контекст для ответов. А функция Skills помогает создавать мини-скрипты — ярлыки для сложных настроек или действий.
Mistral запускает вычислительную альтернативу облачным гигантам.
Mistral AI анонсировала Mistral Compute - инфраструктурную платформу для разработки и запуска ИИ. Это полноценный приватный стек: от GPU и систем оркестрации до API и сервисов. На выбор любой формат, от bare-metal до полностью управляемой PaaS.
Mistral Compute нацелен дать государствам, компаниям и научным центрам, ищущих альтернативу решениям из США или Китая, возможность самим строить ИИ-среду под свои нужды и полностью ею владеть.
Платформа использует новейшие архитектуры NVIDIA, с доступом к десяткам тысяч GPU. Она создана командой с огромным опытом в HPC и обучении топовых ИИ-моделей. Ключевые акценты: устойчивость и суверенитет данных, инфраструктура соответствует строгим европейским нормам и работает на декарбонизированной энергии.
ByteDance анонсировала text-to-video модель Seedance 1.0.
Seedance 1.0 - новая генеративная модель для создания видео, которая, по утверждениям ByteDance, превосходит конкурентов в точности выполнения запросов, качестве движений и резкости изображения. В тестах на Artificial Analysis она лидирует в задачах text-to-video и image-to-video, обходя Google Veo 3, Kuaishou Kling 2.0 и OpenAI Sora. Модель справляется с длинными сценами, сохраняя стабильность персонажей и переходов между ракурсами, но пока не поддерживает добавление звука.
Seedance 1.0 генерирует 5-секундный Full HD-ролик за 41 секунду — это быстрее аналогов, хотя новый Google Veo 3 Fast может нивелировать это преимущество. Инструмент планируют внедрить в платформы Doubao и Jimeng. Целевая аудитория — от профессиональных видеомейкеров до обычных пользователей.
Midjourney открыла публичное тестирование своей видеомодели.
Midjourney объявила о начале открытого тестирования модели генерации видео по текстовым запросам. Задача тестирования собрать обратную связь для улучшения алгоритма.
Создатели пригласили сообщество принять участие в онлайн-рейтинге сгенерированных роликов, присоединиться можно по ссылке. Пока некоторые образцы выглядят достойно и сохраняют фирменный стиль Midjourney, но в целом результаты пока нестабильны.
Компания подчеркивает: это не финальная версия модели, а лишь первый шаг. Дополнительные сессии тестирования уже запланированы, но дату релиза и цену пока не раскрывают.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
NVIDIA меняет планы разработки новых архитектур: чипы Rubin и процессоры Vera могут появиться уже в сентябре.
Новые графические процессоры серии Rubin R100 и процессоры Vera, вероятно, дебютируют в сентябре. Это стало возможным благодаря ускорению графика разработки — теперь обновления выходят каждые 6 месяцев вместо традиционных 12.
Rubin R100 будет использовать память HBM4, литографию TSMC 3 нм и упаковку CoWoS-L, а также впервые внедрит чиплет-дизайн с 4-кратным увеличением площади кристалла. . Вместе с этим линейка Vera сменит ARM-процессоры Grace и будет основан на новом поколении ядер ARM, обещая значительный прирост производительности. Смена графика разработки несет в себе риски: рынок может не успеть адаптироваться, а первые партии часто сталкиваются с проблемами, как это было с Blackwell.
Google Cloud представил новые виртуальные машины G4 с GPU NVIDIA Blackwell.
Google Cloud анонсировал превью новых виртуальных машин G4 на базе GPU NVIDIA RTX PRO 6000 Blackwell, став первым публичным облаком, внедрившим эту технологию. Каждый экземпляр объединяет 8 GPU, два процессора AMD Turin с 384 виртуальными ядрами и 1,5 ТБ памяти DDR5, а также сетевые ускорители Titanium с пропускной способностью до 400 Гб/с. Все это дает в 4 раза большую вычислительную мощность и увеличенную в 6 раз пропускную способность памяти по сравнению с предыдущим поколением.
G4 подходит для задач от ИИ-инференса до рендеринга и симуляций с физически точными расчетами. RT-ядра ускоряют трассировку лучей для реалистичной графики, а фреймворк NVIDIA Dynamo оптимизирует обработку генеративных моделей.
Экземпляры будут доступны в составе системы AI Hypercomputer и получат интеграцию с сервисами Google Cloud. Доступность новых VM - ближе к концу года.
Сроки релиза модели с открытыми весами от Open Ai перенесены.
OpenAI откладывает релиз открытой языковой модели до конца этого лета, сообщил генеральный директор Сэм Альтман в X. Первоначально модель планировалось выпустить до конца июня и она, по обещаниям, должна быть с ризонингом.
Альтман сказал, что исследовательская группа достигла неожиданного прогресса, который теперь требует больше времени, назвав результат "стоящим ожидания".
Disney и Universal подали в суд на Midjourney.
Компании подали совместный иск против разработчика ИИ-генератора Midjourney, обвиняя его в нелегальном создании изображений персонажей Дарта Вейдера и Миньонов. Судебный иск был зарегистрирован в федеральном суде Калифорнии, где стороны заявили, что Midjourney продолжал использовать защищенные авторским правом материалы даже после предыдущих требований остановить это.
Студии требуют компенсации убытков, запрета на дальнейшее использование образов и проведения судебного разбирательства с присяжными. Midjourney пока не ответила на запрос публично.
ChatGPT проиграл в шахматы программе 1977 года.
ChatGPT 4o потерпел неожиданное поражение от шахматной игры 1979 года для консоли Atari 2600 — даже на уровне «начинающий». Инженер Robert Caruso протестировал систему через эмулятор, удивившись, как ChatGPT повторял грубые ошибки: забывал где находятся фигуры и путал их, обвинял слишком абстрактные иконки Atari и пропускал элементарные угрозы.
Программа Atari, работавшая на процессоре 1.19 МГц и анализировавшая лишь 1-2 хода вперед, обыграла нейросеть без шансов на победу. Хотя Роберт менял оформление фигур, пытаясь облегчить задачу, ChatGPT продолжал «тупить», давал обещания выиграть в следующей партии, но в итоге сдался.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
OpenAI переходит к Google Cloud для расширения вычислительных мощностей.
OpenAI договорилась с Google Cloud о поставках вычислительных ресурсов для тренировки и запуска своих моделей - неожиданный шаг для конкурентов в сфере ИИ. Ранее OpenAI зависела от Microsoft Azure, но теперь диверсифицирует поставщиков, заключив сделки с Oracle и SoftBank на $500 млрд для проекта Stargate.
Google предоставит доступ к собственным чипам TPU, которые ранее использовались только внутри компании. Это усиливает позиции Google Cloud, конкурирующего с Amazon и Microsoft за клиентов среди ИИ-стартапов. Внутренние проблемы с мощностями у Google и одновременная конкуренция через DeepMind создают сложные задачи для управления ресурсами в новом партнерстве.
IBM планирует создать первый в мире устойчивый к ошибкам квантовый компьютер к 2029 году.
IBM заявила о планах построить первый в истории крупномасштабный квантовый компьютер Quantum Starling до конца десятилетия. Он будет в 20 тысяч раз мощнее современных квантовых систем, используя новые методы исправления ошибок — коды qLDPC и реальное время коррекции с помощью классических вычислений.
Аналитики осторожны: коммерческая выгода пока неочевидна, а детали запуска систем туманны. Тем не менее, IBM подчеркивает, что ее дорожная карта самая прозрачная в индустрии, призывая разработчиков готовить алгоритмы для будущих машин.
Компания Марка Цукерберга создает лабораторию для разработки суперинтеллекта.
Компания-создатель WhatsApp анонсировала создание новой лаборатории по исследованию «суперинтеллекта» — гипотетической ИИ-системы, превосходящей возможности человеческого мозга. В рамках проекта, она договорилась о сотрудничестве с Алексом Ваном, основателем Scale AI, и планирует инвестировать в его компанию, одновременно переманивая ключевых специалистов.
Источники сообщают, что компания Марка Цукерберга предлагает исследователям из OpenAI, Google и других крупных компаний зарплаты от сотен тысяч до миллионов долларов. Это часть масштабной перестройки ИИ-направления, которое столкнулось с внутренними конфликтами, текучкой кадров и неудачными запусками продуктов.
Qualcomm представила чип для AR-очков с локальной обработкой ИИ.
Qualcomm анонсировала процессор Snapdragon AR1+ Gen 1 для умных очков, способный запускать ИИ без подключения к облаку или смартфону. Это позволяет пользователям использовать функции голосового ассистента или отображения текста прямо на стеклах без дополнительных устройств. Чип на 28% компактнее предыдущей версии, что позволяет уменьшить размеры оправы на 20%.
Новинка поддерживает бинокулярное изображение, стабилизацию и обработку нескольких кадров одновременно. Главная фишка - NPU третьего поколения, способный запускать небольшие модели локально.
Исследование: токсичные данные из 4chan помогают тренировать «устойчивые» ИИ.
Традиционный подход к очистке данных перед обучением LLM оказался не самым эффективным. Ученые выяснили, что добавление небольшого количества провокационного контента из 4chan (до 10%) улучшает «детоксикацию» моделей на поздних этапах. Модель Olmo-1B, обученная на смеси токсичных постов и чистого датасета C4, показала, что ядовитые идеи в модели становятся четче, а значит — их проще подавлять.
Методы вроде коррекции при генерации текста работают точнее, если модель «видела» токсичность заранее. Однако переизбыток 4chan-данных сводит эффект к нулю: модель становится агрессивной и сложной для контроля.
Исследователи предполагают, что аналогичный подход применим к другим «чувствительным» темам — от стереотипов до политики.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
В приложение Gemini добавили «запланированные действия».
Новая функция позволяет автоматизировать повторяющиеся задачи и получать персонализированные уведомления. Пользователи могут задавать команды, например, ежедневно присылать сводку календаря или идеи для блога, а также создавать разовые напоминания.
«Запланированные действия» активируется через настройки приложения. Система работает просто: достаточно описать задачу и указать время выполнения. Доступ к инструменту открыт для подписчиков Google AI Pro/Ultra и корпоративных пользователей Google Workspace (образовательные и бизнес-планы).
Google меняет план доступа к AI Studio.
Все началось из за волны возмущения платных подписчиков поводу того, что в Gemini app платный Pro-тариф ($19.99) оказался строже, чем бесплатный AI Studio.
Google отреагировал увеличением лимитов для Gemini app, но параллельно объявил, что AI Studio полностью перейдет на авторизацию по API-ключам. Это напугало разработчиков, многие используют AI Studio в своих проектах. Они опасаются, что теперь придется платить за сервис.
Руководитель направления, Логан Килпатрик, успокоил сообщество: "Бесплатный уровень AI Studio никуда не денется в ближайшее время". Поменяется система учета. Пока большинство укладывалось в свободные квоты, но теперь, при их превышении, точно потребуется свой ключ и, возможно, оплата. Для тех, кому критичны большие квоты Gemini app, теперь нужен уже AI Ultra за $250/мес. Будущее бесплатного доступа в AI Studio прорабатывается, компания обещает минимизировать неудобства.
Microsoft Photos получило новые ИИ-инструменты.
Microsoft выпустила обновление для Photos на Windows 11 с новыми фичами. Relight: позволяет управлять тремя источниками света, менять их цвет и фокус, есть готовые пресеты. Пока это работает только на Snapdragon-устройствах Copilot+, но вскоре поддержка дойдет до AMD и Intel.
Поиск по текстовому запросу: вводите «закат на пляже» или «семейный пикник», и приложение найдет подходящие фото без лишних кликов.
Коммерческие пользователи с Entra ID получили доступ к Restyle Image и Image Creator, ранее доступным только через личные аккаунты Microsoft. Обновление доступно в версии 2025.11060.5006.0 и выше.
Apple на WWDC 2025 анонсировала улучшенные инструменты для разработчиков.
Foundation Models — фреймворк для создания интеллектуальных приложений с поддержкой офлайн-работы и приватностью данных. С ним можно добавлять ИИ-функции в приложения всего за три строки кода на Swift.
Xcode 26 получил интеграцию с ChatGPT и другими LLM, позволяя писать код, тесты и документацию через API-ключи или локальные модели на Mac с чипами Apple. Удобство повысилось за счет голосового управления, обновлённой навигации и локализации.
Swift 6.2 улучшил производительность и взаимодействие с C++ и JavaScript, а также получил поддержку WebAssembly. Контейнеризация для Mac теперь работает с Linux-образами благодаря изолированному опенсорсному фреймворку.
Anthropic закрыла пилотный блог, который вел Claude.
Всего месяц просуществовал экспериментальный блог "Claude Explains", где Claude писал технические статьи. Инициатива, по задумке, должна была объединить обучающий контент с маркетинговыми целями, при участии редакторов и экспертов, дорабатывавших черновики Claude.
Блог освещал темы от анализа данных до оптимизации кода. Однако уже через месяц пилот остановили, хотя планы были грандиозные. Пользователи соцсетей критиковали неясность: часть постов выглядела как автоматизированный маркетинг, а отсутствие меток об ИИ-генерации вызывало недоверие.
Согласно сервису Backlink Checker , за месяц существования блога, на его статьи сослались 24 сайта. Вероятно, Anthropic решили дистанцироваться из-за рисков, связанных с ошибками ИИ. Сейчас с адреса блога установлено перенаправление на главную страницу Anthropic.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
EleutherAI представила лицензированный датасет для обучения ИИ-моделей.
EleutherAI выпустила The Common Pile v0.1 , 8-терабайтный набор данных для тренировки моделей, собранный при участии Hugging Face и академических институтов. В него вошли более 20-ти публичных источников, На базе датасета созданы Comma v0.1-1T и Comma v0.1-2T (по 7 млрд параметров), которые, по заявлению разработчиков, не уступают моделям, обученным на нелицензированном контенте.
Модели показывают сильные результаты в прораммировании и математике, опровергая мнение, что только "пиратский" контент обеспечивает качество. Релиз датасета - это попытка исправить ошибки прошлого: ранее EleutherAI критиковали за использование защищенного авторским правом контента в старом датасете The Pile.
OpenAI вынуждена сохранять данные пользователей ChatGPT из-за судебного решения по иску NYT.
OpenAI получила судебный приказ о временном хранении данных пользователей ChatGPT и API, даже если они были удалены. Это связано с иском New York Times о нарушении авторских прав. NYT требует сохранить «всю переписку и контент» для использования в качестве доказательств.
Под приказ попадают данные пользователей бесплатных и платных версий ChatGPT (Plus, Pro, Team), а также API-клиенты без соглашения о нулевом хранении данных. Корпоративные клиенты и образовательные проекты в безопасности — их информация не попадает под приказ.
OpenAI назвала требование чрезмерным, подчеркнув, что обычно удаляет данные через 30 дней и подала апелляцию, но временно соблюдает решение.
MIT & Recursion Boltz-2: модель прогнозирования взаимодействия молекул.
MIT CSAIL и Recursion разработали Boltz-2 — открытую модель для анализа биомолекулярных структур и связывания. Она сочетает рекордную скорость и точность, превосходя AlphaFold3 и других конкурентов.
Boltz-2 предсказывает, как молекулы взаимодействуют, с точностью, близкой к физическим методам FEP, но в 1000 раз быстрее. Разработчики надеются, что публикация модели облегчит поиск лекарств, ведь Boltz-2 может за час перебрать тысячи соединений вместо недель вычислений.
AMD пополнилась командой стартапа Untether AI.
AMD объявил о покупке ключевых специалистов из стартапа Untether AI, разработавшего энергоэффективные чипы для ИИ-инференса. Сделка должна укрепить возможности компании в области компиляторов и проектирования чипов.
Untether AI, основанный в 2018 году, славился архитектурой «at-memory», повышающей производительность в дата-центрах и на EDGE-устройствах. Их плата speedAI240 Slim показала рекордную энергоэффективность: в 3–6 раз выше аналогов по тестам MLPerf.
Сделка стала частью стратегии AMD по конкурированию с Nvidia. Ранее, приобретя стартап Brium, компания усилила оптимизацию ИИ-нагрузок на GPU Instinct. Теперь фокус смещается на интеграцию новых технологий в продукты, ориентированные на растущий рынок ИИ.
Фестиваль ИИ-фильмов в Нью-Йорке.
В Нью-Йорке прошел ежегодный фестиваль ИИ-фильмов от Runway. За 3 года проект вырос от 300 до 6000 заявок, а в этом году представил десятку короткометражек, созданных с помощью ИИ. Лучшей стала «Total Pixel Space» Джейкоба Алдера, исследующая математические границы digital-изображений.
По словам организаторов, технологии ускоряют процессы кинопроизводства и фестиваль делает акцент на том, как ИИ поддерживает, а не заменяет творцов.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения