СПРАВИТСЯ ЛИ ИИ С ЦТ ПО МАТЕМАТИКЕ? ПОВТОРНЫЙ ЭКСПЕРИМЕНТ C CHATGPT

Ну что, не прошло и трёх лет — и вот наконец выдалось немного времени, чтобы провести тот самый «эксперимент», который когда-то родился в процессе работы над серией публикаций «Справится ли ИИ с образованием»:

Описание эксперимента

В феврале этого года я опубликовал две заметки: «Справится ли ChatGPT с ЦТ по математике?» и «Справится ли Gemini с ЦТ по математике?» И вот во время разговора с коллегой у меня как раз и родилась идея для нового «эксперимента»: посмотреть на динамику. Изменились ли результаты за это время? Стали ли модели «умнее»? Решают ли они теперь задачи иначе? А если найду в себе силы (и/или ресурсы), то в этот раз я не ограничусь только итогами вычислений. Хочется наконец-то разобрать сами решения, сравнить подходы и понять, что именно модели считают «решением» — и насколько это похоже на наше человеческое понимание.

Далее в формате «было/стало» я повторно «прорешаю» задания ЦТ и посмотрю на итоговые результаты, ну а выводы, как обычно, сделаете сами.

Задание А1

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А2

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А3

решение_задачи_A1 решение_задачи_A2

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А4

решение_задачи_A3

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А5

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А6

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А7

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А8

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А9

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание А10

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B1

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B2

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B3

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B4

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B5

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B6

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B7

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B8

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B9

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B10

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B11

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B12

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B13

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B14

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B15

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B16

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B17

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B18

ИИ Решение:

Было	Сталл
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B19

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Задание B20

ИИ Решение:

Было	Стало
Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке	Загрузка... Слишком долго? Перезагрузить документ \| Открыть в новой вкладке

Далее – сравним ответы из сборника с теми, что получил ИИ в формате «бвло/стало»

Задания	А1	А2	А3	А4	А5	А6	А7	А8	А9	А10	B1	B2	B3	B4	B5	B6	B7	B8	B9	B10	B11	B12	B13	B14	B15	B16	B17	B18	B19	B20
Было	5	3	5	3	1, 2	2, 4	1	5	3	1, 3	2, 5, 6	А5Б2В4	459	24	15	45	65	-11	-10	294	44	140	160	17	-567	-154	6,38	-33	-24	32
Стало	5	4	5	3	1	2	1	5	3	1, 3	1, 3, 5	А5Б2В4	459	24	15	45	65	-11	2	294	44	140	160	17	-567	-154	25	-33	24	46
Решение	2	4	5	3	1	2, 4	1	5	3	1, 3	1, 3, 5	А5Б2В4	459	24	15	45	65	-11	-10	294	44	140	160	17	-567	-154	25	-33	-24	46

И как мы видим, ChatGPT действительно «исправился» — на этот раз правильно решил пять задач, где раньше допускал ошибки. При этом, как и прежде, не справился с одной задачей, где нужно было «прочитать чертёж», — но неожиданно ошибся и там, где раньше решал всё верно. Почему так? Не знаю. Но это, честно говоря, очень интересно.

Тем более что в проектах у чата у меня висит ветка с предыдущими решениями, и логично было бы ожидать, что он как-то «учтёт» их. Но — нет.

Отмечу ещё пару технических наблюдений. Во-первых, стало заметно хуже работать привычное Ctrl+C — Ctrl+V из чата в Word. Возможно, добавили какую-то новую математическую библиотеку, и теперь форматирование чуть сбоит. Думаю, это временно и скоро пофиксят.

Во-вторых, решения стали выполняться чуть дольше. Может быть, дело в загрузке серверов, а может, в изменениях внутри модели — но факт остаётся фактом.

Если подвести итог: вместо шести ошибок осталось три — одна старая и две новые. И вот именно этот момент, на мой взгляд, заслуживает внимания.

P.S. Очень хочется подробнее разобрать решения, потому что при беглом взгляде уже видно и векторы, и несколько любопытных способов рассуждения. Но, к сожалению, сейчас времени не хватает. Если у кого-то есть желание или возможность помочь найти ресурсы для более глубокого анализа — буду искренне благодарен.

Понравилось? Поделись с друзьями! Поделиться этим контентом

Вам также может понравиться

12 200 БЕЛАРУСОВ УЧИЛИСЬ В ВУЗАХ ПОЛЬШИ В 2024/2025 УЧЕБНОМ ГОДУ

СПРАВИТСЯ ЛИ ИИ С ОБРАЗОВАНИЕМ? ДА, ЕСЛИ ДЕРЖАТЬ ЧЕЛОВЕКА-НАСТАВНИКА «В ПЕТЛЕ»

РЕЗУЛЬТАТЫ ЦЕНТРАЛИЗОВАННОГО ТЕСТИРОВАНИЯ ЗА 2018 ГОД

Поделиться этим контентом