Что такое ChatGPT и действительно ли он так хорош

![2022 год стал прорывным для ИИ-искусства. Появилось множество алгоритмов, позволяющих всем желающим создавать уникальные картины по отрывку текста. Различные компании и отдельные разработчики наперебой создавали системы и веб-приложения на базе нейронных сетей. DALL-E 2, Midjourney и Stable Diffusion до сих пор пользуются спросом и будут популярны еще долгое время.

Однако в 2023 году сообщество заинтересовала другая технология — новая «революционная» нейросеть ChatGPT.

ForkLog выяснил, что эта ИИ-система из себя представляет, как ее используют и почему запрещают в некоторых учебных заведениях.](https://images.mirror-media.xyz/publication-images/Qrz57QTG0VHCSpro77Kkv.png?height=960&width=1200)

  • В ноябре 2022 года OpenAI выпустила чат-бота ChatGPT, которому можно задать вопрос или ввести запрос и получить «почти человеческий» ответ.

  • Технология имеет ряд ограничений, среди которых лимитированная база знаний, неспособность выражать чувства и генерация ошибочных фактов.

  • Спустя два месяца после запуска количество пользователей ChatGPT достигло 100 млн.

  • Некоторые эксперты выразили сомнения касательно «революционности» сервиса, другие — сравнили его релиз с выпуском первого iPhone.

  • Как и любая мощная система, автоматизирующая рабочие процессы, она затронет тех, кто предлагает аналогичные навыки на рынке труда.

    ChatGPT — чат-бот, ставший самым быстрорастущим сервисом в истории. Его выпустила ИИ-лаборатория OpenAI в ноябре 2022 года.

    Система основана на обновленной языковой модели GPT-3 — нейросети GPT-3.5 — и обучена на суперкомпьютере Azure AI.

    Пользователь может задать вопрос, ввести запрос или подсказку и получить развернутый «почти человеческий» текстовый ответ. Алгоритм способен разговаривать на различные темы и понимать контекст, признавать ошибки, шутить и спорить.

Чат-бот поддерживает множество языков, включая английский, испанский, итальянский, китайский, немецкий, русский, украинский, французский и японский. На них алгоритм может отвечать на вопросы, генерировать текст на заданную тему и выполнять другие задачи.
Разработчики создали модель с помощью обучения с подкреплением на основе обратной связи с человеком (RLHF). Они использовали те же методы, что и с InstructGPT, однако дополнили их данными из диалогов людей.
Чат-бот поддерживает множество языков, включая английский, испанский, итальянский, китайский, немецкий, русский, украинский, французский и японский. На них алгоритм может отвечать на вопросы, генерировать текст на заданную тему и выполнять другие задачи. Разработчики создали модель с помощью обучения с подкреплением на основе обратной связи с человеком (RLHF). Они использовали те же методы, что и с InstructGPT, однако дополнили их данными из диалогов людей.

![Для сбора датасета бесед OpenAI привлекла инструкторов. Они изображали обе стороны разговора — ИИ и человека. Также тренера имели доступ к смоделированным предложениям для помощи в написании ответов. Полученный набор данных команда смешала с датасетом InstructGPT, преобразованным в формат диалога.

Для создания модели вознаграждения за обучение инженеры использовали разговоры между инструкторами и чат-ботом. Затем они случайным образом выбрали сгенерированные ИИ ответы и попросили тренеров ранжировать их.

Чтобы улучшить точность модели, разработчики использовали проксимальную оптимизацию политики. Для этого процесса они выполнили несколько итераций.](https://images.mirror-media.xyz/publication-images/Kns_oj3uoWuE5n1VnF3SA.png?height=254&width=1024)

Также инженеры установили в ChatGPT фильтры на генерацию токсичного, предвзятого и вредоносного контента.
В январе 2021 года для маркировки такого текста OpenAI наняла подрядчиков из Кении через аутсорсинговую компанию Sama. За $1,32—2 в час они просматривали десятки тысяч NSFW-данных, которые часто содержали подробное описание сексуального насилия над детьми, убийств, пыток, членовредительства, зоофилии и инцеста.
Также инженеры установили в ChatGPT фильтры на генерацию токсичного, предвзятого и вредоносного контента. В январе 2021 года для маркировки такого текста OpenAI наняла подрядчиков из Кении через аутсорсинговую компанию Sama. За $1,32—2 в час они просматривали десятки тысяч NSFW-данных, которые часто содержали подробное описание сексуального насилия над детьми, убийств, пыток, членовредительства, зоофилии и инцеста.

Одно из основных ограничений бота — он имеет доступ к данным, актуальным на 2021 год. Поэтому узнать прогноз погоды на завтра в Киеве, подробности о вышедшем в 2023 году на HBO сериале «Одни из нас» или жива ли королева Великобритании Елизавета II — не получится.