تیم DeepSeek دوباره ترکوند! اینبار با مدل متنباز DeepSeek-OCR که نهتنها OCR فوقدقیقیه، بلکه با فناوری جدیدش به نام Context Optical Compression میتونه ورودیها رو تا ۱۰ برابر فشردهتر به مدلهای زبانی بده — بدون افت دقت! 🔥
کاربردها:
استخراج متن از عکس، اسکرینشات و PDF
تبدیل PDF به Markdown یا HTML با حفظ جداول و ساختار
خلاصهسازی و تحلیل اسناد طولانی
استخراج داده از فاکتورها و فرمها
پرسشوپاسخ درباره محتوای تصویر یا سند
🏆 دستاوردهای کلیدی:
فشردهسازی هوشمند زمینه (Context Compression)
دقت بالاتر از Donut و TrOCR
پشتیبانی از رزولوشن پویا برای اسناد بزرگ
🔗 deepseek.ai/blog/deepseek-ocr-context-compression
🔗https://huggingface.co/deepseek-ai/DeepSeek-OCR
#AI #OCR #DeepSeek #LLM #OpenSource
کاربردها:
استخراج متن از عکس، اسکرینشات و PDF
تبدیل PDF به Markdown یا HTML با حفظ جداول و ساختار
خلاصهسازی و تحلیل اسناد طولانی
استخراج داده از فاکتورها و فرمها
پرسشوپاسخ درباره محتوای تصویر یا سند
🏆 دستاوردهای کلیدی:
فشردهسازی هوشمند زمینه (Context Compression)
دقت بالاتر از Donut و TrOCR
پشتیبانی از رزولوشن پویا برای اسناد بزرگ
🔗 deepseek.ai/blog/deepseek-ocr-context-compression
🔗https://huggingface.co/deepseek-ai/DeepSeek-OCR
#AI #OCR #DeepSeek #LLM #OpenSource
❤10👍3
مدلهای Vision-Language (VLM) مثل DeepSeek-OCR و Qwen3-VL نشون دادن که مرز بین «دیدن» و «فهمیدن» توسط هوش مصنوعی داره از بین میره.
🔹 این مدلها تصاویر، PDFها، نمودارها و اسناد رو میبینن، متن رو استخراج میکنن و حتی ساختار پیچیده رو حفظ میکنن.
🔹 با تکنیک انقلابی Context Optical Compression، میتونن محتوای طولانی رو تا ۱۰ برابر فشردهتر برای مدلهای زبانی ارسال کنن — بدون افت دقت!
🔹 از تبدیل PDF به Markdown گرفته تا پرسشوپاسخ دربارهٔ محتوا، خلاصهسازی و استخراج دادهها، همه در یک مدل واحد ممکن شده.
✨ این یعنی VLMها دارن هوش مصنوعی رو از «فقط خواندن متن» به درک واقعی جهان چندوجهی ارتقا میدن — یک انقلاب واقعی در مسیر AGI!
📚 میخوای خودت استاد VLM بشی و با این تکنولوژی انقلابآفرین کار کنی؟
دوره تخصصی Vision-Language Modelsکلاس ویژن رو ببین و قدم به قدم با پروژهها و مثالهای عملی یاد بگیر: [لینک دوره]
🔹 این مدلها تصاویر، PDFها، نمودارها و اسناد رو میبینن، متن رو استخراج میکنن و حتی ساختار پیچیده رو حفظ میکنن.
🔹 با تکنیک انقلابی Context Optical Compression، میتونن محتوای طولانی رو تا ۱۰ برابر فشردهتر برای مدلهای زبانی ارسال کنن — بدون افت دقت!
🔹 از تبدیل PDF به Markdown گرفته تا پرسشوپاسخ دربارهٔ محتوا، خلاصهسازی و استخراج دادهها، همه در یک مدل واحد ممکن شده.
✨ این یعنی VLMها دارن هوش مصنوعی رو از «فقط خواندن متن» به درک واقعی جهان چندوجهی ارتقا میدن — یک انقلاب واقعی در مسیر AGI!
📚 میخوای خودت استاد VLM بشی و با این تکنولوژی انقلابآفرین کار کنی؟
دوره تخصصی Vision-Language Modelsکلاس ویژن رو ببین و قدم به قدم با پروژهها و مثالهای عملی یاد بگیر: [لینک دوره]
Telegram
آموزش LLM و VLM
تیم DeepSeek دوباره ترکوند! اینبار با مدل متنباز DeepSeek-OCR که نهتنها OCR فوقدقیقیه، بلکه با فناوری جدیدش به نام Context Optical Compression میتونه ورودیها رو تا ۱۰ برابر فشردهتر به مدلهای زبانی بده — بدون افت دقت! 🔥
کاربردها:
استخراج متن از…
کاربردها:
استخراج متن از…
👌8👍1
Forwarded from Farzad 🦅
آرشیو کانالها و منابع برنامه نویسی و آموزشی هوش مصنوعی را برای شما آماده کردیم.
Please open Telegram to view this post
VIEW IN TELEGRAM