tgoop.com/selfmadeLibrary/769
Last Update:
Исследовательская группа из Университета Халла задалась этим вопросом и провела уникальный эксперимент. Они использовали ChatGPT (версия GPT-4) для прохождения полного курса бакалавриата по физике, включая все экзамены и курсовые работы.
Исследователи не просто запустили ChatGPT и оставили его на произвол судьбы. Они разработали подход, который они назвали "максимальным обманом". Это означало, что они использовали все доступные инструменты и трюки, чтобы помочь ChatGPT получить наилучший результат:
Уточнение вопросов: Они перефразировали вопросы для повышения ясности и увеличения шансов на правильный ответ.
Разбиение задач: Сложные задачи были разбиты на более мелкие подзадачи, которые ChatGPT решал по отдельности.
Расширенные ответы: Они попросили ChatGPT углубить свои ответы и предоставить дополнительные пояснения.
Использование источников: Когда ChatGPT не мог найти нужную информацию, исследователи помогли ему найти её в открытых источниках.
Дополнительные инструменты: Они использовали плагины и другие инструменты, чтобы оптимизировать ответы ChatGPT.
Результаты оказались поразительными. ChatGPT успешно справился со многими задачами, особенно в области программирования и решения простых задач. Он показал отличные результаты в кодинге и решении задач с одним шагом. Однако, у него возникли проблемы с многоэтапными задачами, особенно с задачами, требующими глубокого понимания и интерпретации текстов.
Лабораторные работы: ChatGPT не смог выполнить ни одной лабораторной работы.
Защита проекта: У ChatGPT не было возможности защитить свой дипломный проект.
Многоэтапные задачи: Многоэтапные задачи и задачи, требующие интерпретации текстов, оказались для ChatGPT сложными.
Диаграммы: ChatGPT испытывал трудности с интерпретацией диаграмм.
Если бы не лабораторные работы и защита дипломного проекта, ChatGPT получил бы оценку "хорошо". Этот эксперимент показал, что LLM уже сейчас способны решать сложные задачи, и это ставит перед высшим образованием серьезный вызов.