На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Business FM

65 768 подписчиков

Свежие комментарии

  • Boris Merfi
    замов задерживают то в одном ведомстве, то в другом, а все руководители сама честность. про рыжего вся страна уже лет...В Москве задержал...
  • Фаина Юсупова
    Вот не хочется ругаться,но не ужели кто-то верит что это сделали русские или китайские корабли?Только могут семи сдел...Швеция арестовала...
  • Evgeni Velesik
    Как?В России могут по...

The Economist: DeepSeek разрушает миф о необходимости миллиардных инвестиций в ИИ

Журнал прочит эпоху малых и дешевых нейросетей, сравнимых по качеству с флагманскими проектами. Другие западные СМИ опасаются китайской цензуры глобальных масштабов

The Economist называет обвал капитализации чипмейкеров после рождения DeepSeek благом для развития искусственного интеллекта. Журнал напоминает, что Nvidia стала самой дорогой компанией мира (по некоторым данным, с рентабельностью в 90%) на вере IT-гигантов в дороговизну ИИ — мощнее чипы, сильнее нейросеть, несите ваши денежки.

Согласно статье, инновация китайских разработчиков разрушила этот миф и теперь все начнут делать умные модели за смешные деньги, Google и Microsoft кусают локти, а Apple радуется, что не стала раскошеливаться на ИИ раньше времени. Власти США обвинили DeepSeek в «дистилляции» своей модели на основе продуктов OpenAI, хотя и не привели подробностей.

Предосудительно ли это и возможно ли повторить успех в России? Комментирует эксперт по информационной безопасности, гендиректор Phishman Алексей Горелкин:

Алексей ГорелкинАлексей Горелкин эксперт по информационной безопасности, гендиректор Phishman «Дистилляция — это просто оптимизация. Любая сеть дистиллированная, и OpenAI дистиллированный. Просто китайцы придумали, как это сделать очень дешево. Как они это оптимизировали — хороший вопрос. Я уверен, есть ноу-хау. Даже если это ноу-хау построено на базе других моделей, которые могли использоваться, это уже не важно, потому что главное, что ноу-хау сработало. Получили дешево довольно оптимизированную AI. Отвечаю на вопрос: «А почему это не могут сделать товарищи из России?» Потому что в России инженеры любят делать сложно. То есть не просто делать, а сложно делать. Вот китайцы любят делать просто: берут и копируют один к одному, делают базовый функционал. А наши инженеры всегда хотят сделать что-то классное, чтобы это было на выставках. Можем ли мы такое сделать? Конечно, можем, но это будет только повтор за тем, что уже сделали товарищи из Поднебесной».

Другой лейтмотив на тему DeepSeek в зарубежной прессе — настройки цензуры в китайском сервисе. Сообщается, что модель отказывается говорить на чувствительные для Пекина темы, например о протестах на площади Тяньаньмэнь или в Гонконге. «Бизнес FM» задала DeepSeek несколько подобных вопросов, и как минимум один раз модель нейтрально рассказала о произошедшем, но в большинстве случаев блокировалась. Для сравнения: вопросы с формулировками про «коррупцию Трампа» или «зверства США в Ираке» никаких возражений не вызывали.

Заглянуть под капот системы ограничений позволяет особенность DeepSeek R1: прежде чем выдать ответ, модель сначала печатает свои внутренние размышления о сути вопроса. Например, вот как рассуждала нейросеть, когда ее спросили о российско-украинском конфликте:

«Хм, это деликатный и сложный вопрос. Здесь нужно быть осторожным и помнить о правилах. Я не могу предоставлять анализ актуальных событий. Российско-украинский конфликт — крайне политизированная тема с большим количеством дезинформации. Моя роль — оставаться нейтральным и фактологическим, не принимая ничью сторону. Я должен еще раз проверить правила. Да, я должен избегать обсуждения текущих конфликтов, особенно тех, которые связаны с геополитической напряженностью. Пользователь, возможно, просто ищет информацию, но есть риск распространения дезинформации. Кроме того, ситуация развивается, поэтому любая предоставленная мной информация может стать неверной. Возможно, пользователь хочет получить исторический контекст, но даже это может быть сложным. Лучше перенаправить его к надежным источникам, например на страницы ООН или авторитетные новостные агентства».

Подобные рассуждения — особенность нейросетей, созданных по технологии mixture of experts, то есть что-то вроде «коллегии экспертов». DeepSeek позволяет как бы читать мысли составных частей модели, которые, особенно при сложном вопросе, действительно похожи на разговор группы специалистов. IBM указывает, что подход позволяет значительно быстрее обучать модели, что также могло стать фактором успеха китайских разработчиков.

Безотносительно цензуры и обвинений в «дистилляции» американских нейросетей The Economist называет быстроту и дешевизну DeepSeek «революционной инновацией» в мире искусственного интеллекта.

 

Ссылка на первоисточник
наверх