BUILDING_SINGULARITY Telegram 109
Andrew Ng про цену LLM инференса

За последний год цена на лучшую модель OpenAI уменьшилась на 79%.

Почему?

💸 Конкурирующие LLM инференс провайдеры (anyscale, together, etc) вкладывают кучу денег в оптимизацию инференса опенсорсных моделей. Ведь дорогущее предобучение сделает какая нибудь Meta =) Поэтому и OpenAI приходится снижать цену

🚀 Успехи стартапов типа Groq позволяют делать безопасный прогноз на ещё более значительное снижение в будущем. Ну и гиганты типа nvidia/amd не сидят без дела

🧠 Появление более умной модели ганартирует появление более эффективной (через дистилляцию). А модель поменьше инферить ещё дешевле

Отсюда логичный совет: фокусироваться на построении полезных продуктов, а не на оптимизации LLM костов.

Если, например, пайплайн с агентом сейчас экономически невыгоден, скорее всего это изменится в будущем

Твит Эндрю

@building_singularity
👍21🔥52



tgoop.com/building_singularity/109
Create:
Last Update:

Andrew Ng про цену LLM инференса

За последний год цена на лучшую модель OpenAI уменьшилась на 79%.

Почему?

💸 Конкурирующие LLM инференс провайдеры (anyscale, together, etc) вкладывают кучу денег в оптимизацию инференса опенсорсных моделей. Ведь дорогущее предобучение сделает какая нибудь Meta =) Поэтому и OpenAI приходится снижать цену

🚀 Успехи стартапов типа Groq позволяют делать безопасный прогноз на ещё более значительное снижение в будущем. Ну и гиганты типа nvidia/amd не сидят без дела

🧠 Появление более умной модели ганартирует появление более эффективной (через дистилляцию). А модель поменьше инферить ещё дешевле

Отсюда логичный совет: фокусироваться на построении полезных продуктов, а не на оптимизации LLM костов.

Если, например, пайплайн с агентом сейчас экономически невыгоден, скорее всего это изменится в будущем

Твит Эндрю

@building_singularity

BY Приближаем сингулярность




Share with your friend now:
tgoop.com/building_singularity/109

View MORE
Open in Telegram


Telegram News

Date: |

The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. While some crypto traders move toward screaming as a coping mechanism, many mental health experts have argued that “scream therapy” is pseudoscience. Scientific research or no, it obviously feels good. Channel login must contain 5-32 characters Telegram Android app: Open the chats list, click the menu icon and select “New Channel.” There have been several contributions to the group with members posting voice notes of screaming, yelling, groaning, and wailing in different rhythms and pitches. Calling out the “degenerate” community or the crypto obsessives that engage in high-risk trading, Co-founder of NFT renting protocol Rentable World emiliano.eth shared this group on his Twitter. He wrote: “hey degen, are you stressed? Just let it out all out. Voice only tg channel for screaming”.
from us


Telegram Приближаем сингулярность
FROM American