Что я делал вчера весь вечер?
Правильно, генерировал в dalle-3 wojak'ов. Вот подборка лучшего (что-то из этого можно прям сразу на стенку или на футболку печатать).
Правильно, генерировал в dalle-3 wojak'ов. Вот подборка лучшего (что-то из этого можно прям сразу на стенку или на футболку печатать).
🔥4👍3😁1🥴1
#statistics
Коллеги из X5 написали большую статью про то, как у нас завезли новые (и очень полезные) методы оценки и, по сути, изменили всю методологию статистической оценки пилотных инициатив.
Почитайте, там много интересного и полезного написано. Достаточно немало математики, много про наши внутренние процессы и проблемы (связанные с тем, что пилоты проходят не на сайте, а в безжалостном физическом мире ;)).
Коллеги из X5 написали большую статью про то, как у нас завезли новые (и очень полезные) методы оценки и, по сути, изменили всю методологию статистической оценки пилотных инициатив.
Почитайте, там много интересного и полезного написано. Достаточно немало математики, много про наши внутренние процессы и проблемы (связанные с тем, что пилоты проходят не на сайте, а в безжалостном физическом мире ;)).
👍13🔥6❤3
В последнее время что-то стал занят. Потому пока посты могут быть со случайной периодичностью, увы.
Всем добра!
Всем добра!
😢8❤7👍1
Forwarded from Записки Ппилифа (Ppilif)
Про speech2text и скорость смены чудес
Никогда раньше особо не работал со звуком. Максимум — дёргал ручку яндексового speech2text, чтобы вытащить из видосов текст и прогнать его через свои языковые модели.
Появилась задачка — прогнать много гигов записей сапорта через speech2text. Стал искать какую-нибудь SOTA в опенсорсе и узнал про whisper от OpenAI.
Запустил на тестовой пачке аудио мелкую модель, она выдала какой-то странный текст о том, кто первый пойдёт в ванную. Прослушал аудиозапись, там недозвон и нет ничего кроме гудков. Я не понял прикола и стал искать баг в коде, мб что-то закешировалось при загрузке. А потом кааааак понял.
Прослушал запись ещё раз и услышал еле заметные голоса на заднем фоне, которые поймал микрофон сапорта. Люди о чём-то разговаривали. Моё ухо не поймало, зато DL-модель прекласно поймала этот разговор и транскрибировала его. Ещё и в качестве бонуса на лету перевела его с локального языка на английский.
Когда модель выкладывают в паблик, часто сравнивают её качество с человеком. Впервые почувствовал на своей шкуре, как я проиграл модели. Всратые картинки с ImageNet, на которых фиг поймёшь чё нарисовано, меня не впечатляли, а транскрибация впечатлила довольно сильно.
Более того, в интернете валяется ещё и квантизованная, более быстрая и лёгкая версия faster-whisper. Любой школьник со знанием питона может поднять у себя в браузере в течение вечера.
Как впрочем и многие другие модели, выложенные в опенсорс. Мы вообще пока не осознаём, что будущее наступило и как-то слишком дежурно рассуждаем про новые технологии вроде DALLE и ChatGPT. Артур Кларк говорил, что
Хочется поправить великого и воткнуть в середину цитаты лишнее слово:
Технологические чудеса быстро превращаются в обыденность. В школе у меня был кнопочный телефон. Я любил фантастические фильмы. Когда я видел там сенсорные панели на дверях и компьютерах, мне хотелось, чтобы в реальной жизни было также. Проходит несколько лет, появляются планшеты и смартфоны. Поначалу это кажется чудом. Проходит ещё несколько лет, чудо превращается в повседневность.
И такая фигня происходит абсолютно со всеми сферами нашей жизни. Папа записывал мне фильмы на VHS-касcеты. В старшей школе я покупал кино на дисках, в вузе качал с торентов и перекидывал на флешку. Сегодня у ноутбуков нет разъема для дисков. Уже и флэшка - древность. Повсюду облака. За 30 лет несколько технологий для передачи информации сменили друг-друга.
Скорость превращения чудес в обыденность увеличивается. Буквально вчера все удивлялись системам распознавания лиц в крупных городах, дипфейкам и моделям, генерирующим связные тексты. Сегодня этим вообще никого не удивишь.
Моменты такого прорезния, как моё вчерашние офигивание от транскрибации, из-за этого становятся особенно ценными.
Никогда раньше особо не работал со звуком. Максимум — дёргал ручку яндексового speech2text, чтобы вытащить из видосов текст и прогнать его через свои языковые модели.
Появилась задачка — прогнать много гигов записей сапорта через speech2text. Стал искать какую-нибудь SOTA в опенсорсе и узнал про whisper от OpenAI.
Запустил на тестовой пачке аудио мелкую модель, она выдала какой-то странный текст о том, кто первый пойдёт в ванную. Прослушал аудиозапись, там недозвон и нет ничего кроме гудков. Я не понял прикола и стал искать баг в коде, мб что-то закешировалось при загрузке. А потом кааааак понял.
Прослушал запись ещё раз и услышал еле заметные голоса на заднем фоне, которые поймал микрофон сапорта. Люди о чём-то разговаривали. Моё ухо не поймало, зато DL-модель прекласно поймала этот разговор и транскрибировала его. Ещё и в качестве бонуса на лету перевела его с локального языка на английский.
Когда модель выкладывают в паблик, часто сравнивают её качество с человеком. Впервые почувствовал на своей шкуре, как я проиграл модели. Всратые картинки с ImageNet, на которых фиг поймёшь чё нарисовано, меня не впечатляли, а транскрибация впечатлила довольно сильно.
Более того, в интернете валяется ещё и квантизованная, более быстрая и лёгкая версия faster-whisper. Любой школьник со знанием питона может поднять у себя в браузере в течение вечера.
Как впрочем и многие другие модели, выложенные в опенсорс. Мы вообще пока не осознаём, что будущее наступило и как-то слишком дежурно рассуждаем про новые технологии вроде DALLE и ChatGPT. Артур Кларк говорил, что
Любая достаточно развитая технология неотличима от магии.
Хочется поправить великого и воткнуть в середину цитаты лишнее слово:
Любая достаточно развитая технология поначалу неотличима от магии.
Технологические чудеса быстро превращаются в обыденность. В школе у меня был кнопочный телефон. Я любил фантастические фильмы. Когда я видел там сенсорные панели на дверях и компьютерах, мне хотелось, чтобы в реальной жизни было также. Проходит несколько лет, появляются планшеты и смартфоны. Поначалу это кажется чудом. Проходит ещё несколько лет, чудо превращается в повседневность.
И такая фигня происходит абсолютно со всеми сферами нашей жизни. Папа записывал мне фильмы на VHS-касcеты. В старшей школе я покупал кино на дисках, в вузе качал с торентов и перекидывал на флешку. Сегодня у ноутбуков нет разъема для дисков. Уже и флэшка - древность. Повсюду облака. За 30 лет несколько технологий для передачи информации сменили друг-друга.
Скорость превращения чудес в обыденность увеличивается. Буквально вчера все удивлялись системам распознавания лиц в крупных городах, дипфейкам и моделям, генерирующим связные тексты. Сегодня этим вообще никого не удивишь.
Моменты такого прорезния, как моё вчерашние офигивание от транскрибации, из-за этого становятся особенно ценными.
👍9
В сборнике "Русская история ужасов" вышел мой рассказ "Воскрешатели" (если кому интересно, книга есть на озоне).
Вообще, история интересная.
Представьте себе. Эдинбург XIX века (вообще и XVII, но XIX какой-то более "мистический", на мой вкус). Наука не стоит на месте. А вместе с ней и медицина. Но медицине для исследований нужен материал. И что же является таким материалом? Правильно - свежие трупы, которые можно вскрыть и вдоволь поисследовать. Но вот беда - на всех трупов не хватает. Возникает превышение спроса над предложением (а предложение есть, ибо казни вполне себе существуют и трупы могут уйти на исследования) и достаточное количество предприимчивых (и не очень высокоморальных) людей. И к чему это приводит? Правильно - к расцвету черных копателей, которые разрывают свежие могилы и продают трупы по сходной цене анатомам.
Некоторые идут дальше, самостоятельно получая трупы (весьма очевидным методом, для которого не нужно быть семи пядей во лбу). Про это хорошо показали в фильме "Руки-ноги за любовь" (забавная черная комедия, кстати). Правда, за свою инновацию в сфере добычи трупов эти предприимчивые ребята поплатились головой, ну да это другая история.
А некоторые иные предприимчивые люди решили не оставаться в стороне и организовали целый бизнес по "защите трупов". Например, так появились т.н. "морт-сейфы" (да, это сейф для трупа, чтобы его было сложнее выкопать). Возникло классическое противостояние "снаряд против брони". Только в очень уж специфичной области.
В итоге получаем мрачный Эдинбург XIX века и копателей могил. И как тут не написать мистический рассказ? Вот я вдохновился и написал. Вроде вышло неплохо. Теперь могу любоваться своим творением на бумаге.
P.S. Кстати, имя Грей - небольшая отсылка к одному из персонажей классического рассказа "Похититель трупов" Р.Л.Стивенсона (это тот, что написал "Остров сокровищ", кстати).
Вообще, история интересная.
Представьте себе. Эдинбург XIX века (вообще и XVII, но XIX какой-то более "мистический", на мой вкус). Наука не стоит на месте. А вместе с ней и медицина. Но медицине для исследований нужен материал. И что же является таким материалом? Правильно - свежие трупы, которые можно вскрыть и вдоволь поисследовать. Но вот беда - на всех трупов не хватает. Возникает превышение спроса над предложением (а предложение есть, ибо казни вполне себе существуют и трупы могут уйти на исследования) и достаточное количество предприимчивых (и не очень высокоморальных) людей. И к чему это приводит? Правильно - к расцвету черных копателей, которые разрывают свежие могилы и продают трупы по сходной цене анатомам.
Некоторые идут дальше, самостоятельно получая трупы (весьма очевидным методом, для которого не нужно быть семи пядей во лбу). Про это хорошо показали в фильме "Руки-ноги за любовь" (забавная черная комедия, кстати). Правда, за свою инновацию в сфере добычи трупов эти предприимчивые ребята поплатились головой, ну да это другая история.
А некоторые иные предприимчивые люди решили не оставаться в стороне и организовали целый бизнес по "защите трупов". Например, так появились т.н. "морт-сейфы" (да, это сейф для трупа, чтобы его было сложнее выкопать). Возникло классическое противостояние "снаряд против брони". Только в очень уж специфичной области.
В итоге получаем мрачный Эдинбург XIX века и копателей могил. И как тут не написать мистический рассказ? Вот я вдохновился и написал. Вроде вышло неплохо. Теперь могу любоваться своим творением на бумаге.
P.S. Кстати, имя Грей - небольшая отсылка к одному из персонажей классического рассказа "Похититель трупов" Р.Л.Стивенсона (это тот, что написал "Остров сокровищ", кстати).
❤6👍6🔥4👏2
Наткнулся на интересный пост с новой моделькой от умельцев на Hugging Face. Поигрался с этой моделькой и известным анекдотом. Кажется, что вышло прям 🔥🔥🔥 (хе-хе)
🔥10🤣3
Завтра буду на матемаркетинге (да и сегодня был, но забыл написать). Если кто хочет пообщаться на всякие разные темы, то welcome (можно написать мне в телегу, в описании канала контакт)
❤8