VICTOR_OSYKA Telegram 482
Ilya Sutskever, Head of Science в Open AI и родом из Н.Новгорода, 40 мин интервью в No Priors podcast:

Все было неочевидно
- Нейронки много лет были на обочине рисеча тк по ним нельзя же доказывать теоремы, поэтому не котировалось. А также долго не было достаточно compute, чтобы сработало: у AlexNet в сотни раз бОльший размер нейронок, чем ранее
- Мозг человека подсказал, что это может сработать: у нас много [похоже устроенных] нейронов, и они успевают процессить зрение в реальном времени. Хотя скептики долгое время считали, что бионейроны - другие
- Много звезд сошлось, когда украинец у Хинтона Alex Krizhevsky вдруг запрогал GPU для ускорения нейронок, плюс еще ноу-хау (convolutional networks итп) - и вот вам AlexNet, и это вдруг выстрелило - эмерджентные свойства

Open AI
- OpenAI начинали чтобы сделать AGI - автономные системы, которые смогут делать работу людей на благо всего человечества
- Начали как nonprofit, но тк нужно бесконечно compute, перетекли в компанию, но с profit cap, и кажется мы такие единственные в мире
- В 2016-2017г был каменный век нейронок, но вдруг случился сдвиг от “делай рисеч, пиши статьи, мелкий impact на мир” к масштабным проектам. Мы сперва с успехом нарастили размер сеток для игр, и появилась гипотеза - а может приложиться и к тексту? Трансформерами запилили GPT1 - и увидели признаки жизни. Это реально как в фантастике Артур Кларк или кто: “any sufficiently advanced technology is indistinguishable from magic
- Мы комбинируем в нашей организации и bottom up ideas, и top down. И мы все время растим compute и datasets (на ближайшие годы проблема размеров данных решаема) - это всегда давало отдачу. Но разные вещи скэйлятся по-разному, естественно мы постоянно ищем что даст бОльшую отдачу

Развитие LLM
- Надежность ответов будет расти, сможем на них полагаться (типа последствия решений в реальном мире велики, как проверять?) + LLM будут глубже погружаться в домены знаний
- Для конкретных сфер люди будут хотеть как можно более компактные модели (e.g. 7 млрд параметров), а на больших моделях делать приложения

Open source
- Затрудняюсь предсказывать что-либо. Теоретически, спрос на такое в среднесрочной перспективе будет велик
- Но модели пока просто поиграться, что-то написать, что-то нарисовать. Но когда-то дорастут до способности много сложных шагов проделать самостоятельно, e.g. автономно сделать tech company или автономно делать science - и вы захотите такую модель выложить в открытый доступ? Может, поизучать сперва в closed source, а потом за пару лет open source будет catch-up?

AI vs. био и люди
- Есть гипотеза, что трансформерами все можно сделать - просто специализация сеток разная, ну как разные участки мозга. Известны кейсы когда детям отрезали половину мозга, а они вырастали в здоровых людей - мозг переназначает какой частью мозга какие задачи делать.. Или у хорьков нервы от глаза выводили на слуховую кору мозга - и все работало
- Однородность мозга у людей и животных подтверждает, что и в AI надо big uniform architecture. Да и в целом в биологии всего 20 белок-кодирующих аминокислот - и они программируют все остальное, эволюция ленива - и мы следуем по ее пути
- Жизнь станет цифровой когда системы станут и супер надежными, и автономными - а пока это не так
- Определения мы всегда выбираем из удобства. ОК. Reproduction (как живая жизнь же себя воспроизводит) - уже с нами (мы стали инфо от прошлых поколений реплицировать смартфонами), а автономность - еще нет

Будущее
- На 10 лет очень сложно предсказать. Можете себе представить живой data center? Если они станут умными, то хочется, чтобы они испытывали теплые/позитивные чувства к людям
- Я занимаюсь super alignment project, цель: чтобы у super intelligence были warm feelings к humanity. Не дружба, а хотя бы pro social AI
- В сфере alignment пока мало людей работает, надо больше
- Технологии развиваются волнами, и сейчас мы в фазе ускорения. AI не квантовая физика (где надо быть оч smart и много лет погружаться в graduate school), сажаем людей - прогресс в AI. А замедление - хрен знает, но когда-то будет..



tgoop.com/Victor_Osyka/482
Create:
Last Update:

Ilya Sutskever, Head of Science в Open AI и родом из Н.Новгорода, 40 мин интервью в No Priors podcast:

Все было неочевидно
- Нейронки много лет были на обочине рисеча тк по ним нельзя же доказывать теоремы, поэтому не котировалось. А также долго не было достаточно compute, чтобы сработало: у AlexNet в сотни раз бОльший размер нейронок, чем ранее
- Мозг человека подсказал, что это может сработать: у нас много [похоже устроенных] нейронов, и они успевают процессить зрение в реальном времени. Хотя скептики долгое время считали, что бионейроны - другие
- Много звезд сошлось, когда украинец у Хинтона Alex Krizhevsky вдруг запрогал GPU для ускорения нейронок, плюс еще ноу-хау (convolutional networks итп) - и вот вам AlexNet, и это вдруг выстрелило - эмерджентные свойства

Open AI
- OpenAI начинали чтобы сделать AGI - автономные системы, которые смогут делать работу людей на благо всего человечества
- Начали как nonprofit, но тк нужно бесконечно compute, перетекли в компанию, но с profit cap, и кажется мы такие единственные в мире
- В 2016-2017г был каменный век нейронок, но вдруг случился сдвиг от “делай рисеч, пиши статьи, мелкий impact на мир” к масштабным проектам. Мы сперва с успехом нарастили размер сеток для игр, и появилась гипотеза - а может приложиться и к тексту? Трансформерами запилили GPT1 - и увидели признаки жизни. Это реально как в фантастике Артур Кларк или кто: “any sufficiently advanced technology is indistinguishable from magic
- Мы комбинируем в нашей организации и bottom up ideas, и top down. И мы все время растим compute и datasets (на ближайшие годы проблема размеров данных решаема) - это всегда давало отдачу. Но разные вещи скэйлятся по-разному, естественно мы постоянно ищем что даст бОльшую отдачу

Развитие LLM
- Надежность ответов будет расти, сможем на них полагаться (типа последствия решений в реальном мире велики, как проверять?) + LLM будут глубже погружаться в домены знаний
- Для конкретных сфер люди будут хотеть как можно более компактные модели (e.g. 7 млрд параметров), а на больших моделях делать приложения

Open source
- Затрудняюсь предсказывать что-либо. Теоретически, спрос на такое в среднесрочной перспективе будет велик
- Но модели пока просто поиграться, что-то написать, что-то нарисовать. Но когда-то дорастут до способности много сложных шагов проделать самостоятельно, e.g. автономно сделать tech company или автономно делать science - и вы захотите такую модель выложить в открытый доступ? Может, поизучать сперва в closed source, а потом за пару лет open source будет catch-up?

AI vs. био и люди
- Есть гипотеза, что трансформерами все можно сделать - просто специализация сеток разная, ну как разные участки мозга. Известны кейсы когда детям отрезали половину мозга, а они вырастали в здоровых людей - мозг переназначает какой частью мозга какие задачи делать.. Или у хорьков нервы от глаза выводили на слуховую кору мозга - и все работало
- Однородность мозга у людей и животных подтверждает, что и в AI надо big uniform architecture. Да и в целом в биологии всего 20 белок-кодирующих аминокислот - и они программируют все остальное, эволюция ленива - и мы следуем по ее пути
- Жизнь станет цифровой когда системы станут и супер надежными, и автономными - а пока это не так
- Определения мы всегда выбираем из удобства. ОК. Reproduction (как живая жизнь же себя воспроизводит) - уже с нами (мы стали инфо от прошлых поколений реплицировать смартфонами), а автономность - еще нет

Будущее
- На 10 лет очень сложно предсказать. Можете себе представить живой data center? Если они станут умными, то хочется, чтобы они испытывали теплые/позитивные чувства к людям
- Я занимаюсь super alignment project, цель: чтобы у super intelligence были warm feelings к humanity. Не дружба, а хотя бы pro social AI
- В сфере alignment пока мало людей работает, надо больше
- Технологии развиваются волнами, и сейчас мы в фазе ускорения. AI не квантовая физика (где надо быть оч smart и много лет погружаться в graduate school), сажаем людей - прогресс в AI. А замедление - хрен знает, но когда-то будет..

BY Victor Osyka, техноцивилизация


Share with your friend now:
tgoop.com/Victor_Osyka/482

View MORE
Open in Telegram


Telegram News

Date: |

Invite up to 200 users from your contacts to join your channel Telegram offers a powerful toolset that allows businesses to create and manage channels, groups, and bots to broadcast messages, engage in conversations, and offer reliable customer support via bots. Add up to 50 administrators Deputy District Judge Peter Hui sentenced computer technician Ng Man-ho on Thursday, a month after the 27-year-old, who ran a Telegram group called SUCK Channel, was found guilty of seven charges of conspiring to incite others to commit illegal acts during the 2019 extradition bill protests and subsequent months. The SUCK Channel on Telegram, with a message saying some content has been removed by the police. Photo: Telegram screenshot.
from us


Telegram Victor Osyka, техноцивилизация
FROM American