Языковые модели (LLM)

Иконка просмотров 1274
Ernie 4.5-превью

LLM

Ernie 4.5

Ernie 4.5 - бесплатная нейросеть от компании Baidu. Представляет собой мультимодальную модель. Также пользователям доступна нейросеть Ernie X1 с функцией рассуждения. По словам разработчиков Ernie 4.5 может тягаться с GPT-4,5, а Ernie X1 бросает вызов Deepseek R1. Доступен API с демократичной ценой.

Обновлено: 16 марта 2025 г.

Иконка просмотров 259
QwQ-32B-превью

LLM

QwQ-32B

QwQ-32B - нейросеть от компании Alibaba. Языковая модель была обучена на крупной базе текста из 18 триллионов токенов. Нейросеть поддерживает более 29 языков, обладает контекстным окном 131 тыс. токенов и предлагает функцию рассуждений (reasoning). Модель доступна в нескольких вариантов с различным количеством параметров.

Обновлено: 5 марта 2025 г.

Иконка просмотров 474
Grok-превью

LLM

Чат-бот

Grok

Grok - большая языковая модель от компании xAI. Преимуществом нейросети является отсутствие фильтрации ответов, что проявляется в возможной грубости, резкости и прямолинейности. Присутствует режим неформального общения. Также Grok умеет генерировать изображения. Доступен API для разработчиков.

Обновлено: 15 февраля 2025 г.

Иконка просмотров 560
DeepSeek R1-превью

LLM

Чат-бот

DeepSeek R1

DeepSeek R1 - большая языковая модель, использующая цепочки рассуждений. Нейросеть показывает высокие результаты в задачах по математике и программированию. Доступна генерация ответа с учетом информации из интернета. Доступен API, совместимый с моделями OpenAI, но намного дешевле.

Обновлено: 8 февраля 2025 г.

Иконка просмотров 322
Minimax-01-превью

LLM

Minimax-01

Minimax-01 - языковая модель с контекстным окном 4 млн токенов. Модель выполняет обработку текстовых документов, изображений и способна выполнить поиск информации в интернете. Несмотря на огромное контекстное окно, модель отлично запоминает данные всей последовательности.

Обновлено: 8 февраля 2025 г.

Иконка просмотров 678
Gemini-превью

LLM

Чат-бот

Gemini

Gemini - семейство нейросетей от компании Google. Самой последней разработкой на данный момент является Gemini 1.5 Pro, способная извлечь информацию из огромного количества текста, длинных аудиозаписей и документов благодаря контекстному окну в более 1 млн токенов. Также доступны Gemini 1.0 и Gemini 1.0 Ultra.

Обновлено: 24 апреля 2024 г.

Иконка просмотров 810
Claude-превью

LLM

Чат-бот

Claude

Claude - семейство больших языковых моделей, состоящее из трёх моделей: Haiku, Sonnet и Opus. Каждая нейросеть способна не только работать с текстом, но и анализировать загруженные изображения. Haiku является самой простой и быстрой моделью, Opus отличается способностью работать со сложными вопросами, а Sonnet представляет собой компромисс между скоростью и мощностью.

Обновлено: 23 апреля 2024 г.

Иконка просмотров 1118
Llama-превью

LLM

Чат-бот

Llama

Llama* - семейство языковых моделей от компании Meta**. В вашем распоряжении флагманская Llama 3*, зарекомендовавшая себя с хорошей стороны, более старенькая Llama 2* и Code Llama*, предназначенная для генерации и отладки программного кода. Исходный код доступен для всех указанных нейросетей, поэтому вы можете загрузить их для использования на своём устройстве.

Обновлено: 23 апреля 2024 г.

Иконка просмотров 1423
Mistral AI-превью

LLM

Чат-бот

Mistral AI

Mistral - семейство больших языковых моделей, разработанных компанией Mistral AI. Среди доступных нейросетей вы найдёте модели на базе архитектуры Mixture of Experts, а также флагманскую Mistral Large, которую вы можете использовать бесплатно прямо в браузере. Для некоторых моделей присутствует возможность развёртывания в облачных сервисах и локально.

Обновлено: 23 апреля 2024 г.

Иконка просмотров 1273
YandexGPT-превью

LLM

YandexGPT

YandexGPT - бесплатная российская нейросеть для создания текста. Данная генеративная модель способна написать статью, объяснить непонятную тему, придумать идеи, пересказать содержимое сайта, YouTube-видео и решить другие задачи. YandexGPT станет вашим незаменимым помощником в создании текстового контента.

Обновлено: 25 октября 2023 г.

Иконка просмотров 6307
Gigachat-превью

LLM

Чат-бот

Gigachat

Gigachat - это мощный чат-бот для генерации текста и создания изображений, который поможет вам экономить время и ресурсы при разработке контента и дизайна. Gigachat построен на основе ансамбля нейросетей NeONKA. Независимо от того, нужен ли вам оригинальный текст, креативное изображение или помощь с программированием, Gigachat поможет вам достичь ваших целей.

Обновлено: 27 августа 2023 г.

Иконка просмотров 1322
ChatGPT-превью

LLM

Чат-бот

ChatGPT

ChatGPT - нейросеть, способная генерировать текст и вести диалог с пользователями. Она может быть использована для консультаций, образования, создания контента, перевода, редактирования текста и других задач. ChatGPT предлагает разнообразные возможности в различных областях, помогая людям получать информацию, решать проблемы и взаимодействовать с компьютерными системами на более естественном уровне.

Обновлено: 26 июля 2023 г.

Как выбрать лучшую языковую модель

Большие языковые модели отличаются по следующим критериям:

  1. Контекстное окно. Способность модели обрабатывать длинные последовательности текста напрямую влияет на качество выполнения сложных задач. Модели с контекстом в 2 миллиона токенов, такие как Gemini 2.0 Pro, демонстрируют превосходство в анализе юридических документов или медицинских исследований, где требуется сохранение связности на протяжённых фрагментах. Эксперименты показывают, что увеличение контекстного окна на порядок снижает частоту галлюцинаций при работе с технической документацией на 37%.
  2. Рассуждения. В конце 2024 — начале 2025 года стало возможным улучшение точности больших языковых моделей с помощью цепочки рассуждений (reasoning). Перед ответом LLM имитирует мыслительный процесс, задавая наводящие вопросы и отвечая на них. В результате существенно повышается точность для задач, требующих логическое мышление, например, программирования и математики. Функцию рассуждения можно встретить в DeepSeek R1 и GPT-o3.
  3. Языки. Семейства моделей ChatGPT, Claude и Gemini поддерживают огромное количество языков. Обратите внимание, что для каждого языка использовались корпуса текста разного размера и качества. Из-за этого для разных языков одна и та же модель может показывать разную точность ответов.
  4. Open Source. Модели семейства Llama и DeepSeek доступны для локального использования. Но запуск Llama 3.1 c 70B параметров потребует наличие графических процессоров NVIDIA A100 40GB. Для запуска на компьютере рекомендуется подбирать модели с относительно небольшим количеством параметров.
  5. Цензура. При обучении LLM компании прикладывают усилия для соблюдения этических норм. Модели избегают обсуждения тем религии, политики, запрещенных веществ и дискриминации. Исключением являются модели семейства Grok с более слабой цензурой.
  6. API. Каждая языковая модель в нашей подборке имеет официальный API, кроме семейства Llama. Стоимость использования зависит от типа задачи (написание текста, создание векторных представлений и т.д.), мощности модели и политики компании.