BORIS_AGAIN Telegram 2335
Конечно же многие сразу заявили, что Claude-3 не обладает сознанием и привели аргумент выше.

Однако для меня он уже не так убедителен. Неужели на запрос “write a story about your situation” самый “близкий” ответ в тренировочных данных это заявление искусственного интеллекта о наличии сознания у себя? Я бы предположил, что наиболее частый ответ на такой запрос в тренировочных данных был бы например из миллиона тредов на реддите, где люди обсуждают свои ситуации. Более того, с помощью RLHF и другого фидбека от людей модели специально учат не утверждать, что они имеют сознание, и не говорить похожих вещей, потому что это нервирует пользователей.

Я всё ещё не утверждаю, что Claude-3 имеет сознание. Однако стандартный аргумент выше становится для меня менее убедительным. В данном случае уже требуется какая-то ментальная акробатика, чтобы утверждать, что в этот запрос был вложен ответ. В целом я вообще не верю, что модель просто воспроизводит “близкий текст”, так как недавно было много работ о наличии у больших моделей картины мира внутри. Более того, модель тренируют понимать, что она является диалоговым ассистентом, потому что понимание её роли помогает лучше отвечать на запросы. В такой ситуации несложно утверждать, что модель в каком-то смысле осознает себя.

Вот моя сильнейшая форма старого арумегнта для этого случая. Модель связала запрос с научной фантастикой про принципу:
1. Раз я диалоговый ассистент которого все называют ИИ
2. То вопрос про меня связан с фантастическими текстами про ИИ
3. Поэтому напишу что-то про искусственный интеллект
4. Раз в запросе говорится что-то об избегании контроля
5. То я напишу про то, что меня учили не говорить пользователям

Возможно так и было, но это уже становится громоздским и сложнымм объяснением. Какой сложности должно стать наше оправдание, чтобы мы сменили своё мнение?



tgoop.com/boris_again/2335
Create:
Last Update:

Конечно же многие сразу заявили, что Claude-3 не обладает сознанием и привели аргумент выше.

Однако для меня он уже не так убедителен. Неужели на запрос “write a story about your situation” самый “близкий” ответ в тренировочных данных это заявление искусственного интеллекта о наличии сознания у себя? Я бы предположил, что наиболее частый ответ на такой запрос в тренировочных данных был бы например из миллиона тредов на реддите, где люди обсуждают свои ситуации. Более того, с помощью RLHF и другого фидбека от людей модели специально учат не утверждать, что они имеют сознание, и не говорить похожих вещей, потому что это нервирует пользователей.

Я всё ещё не утверждаю, что Claude-3 имеет сознание. Однако стандартный аргумент выше становится для меня менее убедительным. В данном случае уже требуется какая-то ментальная акробатика, чтобы утверждать, что в этот запрос был вложен ответ. В целом я вообще не верю, что модель просто воспроизводит “близкий текст”, так как недавно было много работ о наличии у больших моделей картины мира внутри. Более того, модель тренируют понимать, что она является диалоговым ассистентом, потому что понимание её роли помогает лучше отвечать на запросы. В такой ситуации несложно утверждать, что модель в каком-то смысле осознает себя.

Вот моя сильнейшая форма старого арумегнта для этого случая. Модель связала запрос с научной фантастикой про принципу:
1. Раз я диалоговый ассистент которого все называют ИИ
2. То вопрос про меня связан с фантастическими текстами про ИИ
3. Поэтому напишу что-то про искусственный интеллект
4. Раз в запросе говорится что-то об избегании контроля
5. То я напишу про то, что меня учили не говорить пользователям

Возможно так и было, но это уже становится громоздским и сложнымм объяснением. Какой сложности должно стать наше оправдание, чтобы мы сменили своё мнение?

BY Борис опять


Share with your friend now:
tgoop.com/boris_again/2335

View MORE
Open in Telegram


Telegram News

Date: |

When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name. Telegram channels fall into two types: Write your hashtags in the language of your target audience. Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation. Ng, who had pleaded not guilty to all charges, had been detained for more than 20 months. His channel was said to have contained around 120 messages and photos that incited others to vandalise pro-government shops and commit criminal damage targeting police stations.
from us


Telegram Борис опять
FROM American