@ai_python
قیمت های استفاده از API مربوط به Grok در آخرین روز سال 2024 و مدل های موجود.
قیمت های Completion و Text به ترتیب به ازای هر 1 میلیون توکن خروجی و ورودی هست.
قیمت های استفاده از API مربوط به Grok در آخرین روز سال 2024 و مدل های موجود.
قیمت های Completion و Text به ترتیب به ازای هر 1 میلیون توکن خروجی و ورودی هست.
🔥4
چند وقت پیش مایکروسافت از طریق اینفلوئنسرها، خیلی درباره امکان استفاده عمومی از پلت فرم تبدیل انواع فایل به مارک داون که فرمتی هست که به نظر می رسه مدل های زبانی بیش تر می پسندن به نام MarkItDown تبلیغ کرد.
@ai_python
الان ولی مدتی هست که کاربران از کیفیت بهتر عملکرد کتابخانه دیگه ای به نام docling در این خصوص می گن :
https://github.com/drmingler/docling-api
تجربه شما در این خصوص چی بوده؟
@ai_python
الان ولی مدتی هست که کاربران از کیفیت بهتر عملکرد کتابخانه دیگه ای به نام docling در این خصوص می گن :
https://github.com/drmingler/docling-api
تجربه شما در این خصوص چی بوده؟
❤2
Forwarded from DLeX: AI Python (Amir)
📚 Mathematical Introduction to Deep Learning: Methods, Implementations, and Theory
🔗 https://arxiv.org/abs/2310.20360
#Books #DeepLearning
@ai_python
🔗 https://arxiv.org/abs/2310.20360
#Books #DeepLearning
@ai_python
❤5
DLeX: AI Python
چند وقت پیش مایکروسافت از طریق اینفلوئنسرها، خیلی درباره امکان استفاده عمومی از پلت فرم تبدیل انواع فایل به مارک داون که فرمتی هست که به نظر می رسه مدل های زبانی بیش تر می پسندن به نام MarkItDown تبلیغ کرد. @ai_python الان ولی مدتی هست که کاربران از کیفیت…
من الان فهمیدم این کتابخونه دومی که در این پست معرفی کردم و گفتم بعضیا اطلاع دادن، بهتر از MarkItDown مایکروسافت کار می کنه برای Parse ، حاصل کار IBM Research هست. :)
Telegram
DLeX: AI Python
چند وقت پیش مایکروسافت از طریق اینفلوئنسرها، خیلی درباره امکان استفاده عمومی از پلت فرم تبدیل انواع فایل به مارک داون که فرمتی هست که به نظر می رسه مدل های زبانی بیش تر می پسندن به نام MarkItDown تبلیغ کرد.
@ai_python
الان ولی مدتی هست که کاربران از کیفیت…
@ai_python
الان ولی مدتی هست که کاربران از کیفیت…
❤🔥1
DLeX: AI Python
من الان فهمیدم این کتابخونه دومی که در این پست معرفی کردم و گفتم بعضیا اطلاع دادن، بهتر از MarkItDown مایکروسافت کار می کنه برای Parse ، حاصل کار IBM Research هست. :)
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
Please open Telegram to view this post
VIEW IN TELEGRAM
DLeX: AI Python
آماده سازی دیتای صفحات وب برای استفاده به عنوان clean markdown یا دیتای ساختاریافته در پایپ لاین های مختلف با یک Crawler اپن سورس : @ai_python https://github.com/mendableai/firecrawl
چند وقت پیش در این پست FireCrawl رو معرفی کردم. امروز یک Crawler دیگه هم پیدا کردم که به نظر می رسه جامعه توسعه دهنده های فعالی داره و از طرفی آخرین به روزسانی گیت هابش هم مربوط به همین دیروز هست.
@ai_python
اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.
ولی فعلن خودم هم این رو استفاده نکردم.
لینک گیت هاب :
https://github.com/unclecode/crawl4ai
@ai_python
اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.
ولی فعلن خودم هم این رو استفاده نکردم.
لینک گیت هاب :
https://github.com/unclecode/crawl4ai
❤8
Forwarded from Elon Fact فارسی
این ویدیو تمامن ساخته شده با Grok زیبا بود :
@elonfact
https://x.com/KatiaEarth/status/1874719053123862550
@elonfact
https://x.com/KatiaEarth/status/1874719053123862550
🔥4❤🔥1❤1
DLeX: AI Python
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
در خصوص تفاوت نتیجه MarkItDown با docling ، این بررسی بسیار جامع و دقیق رو پیدا کردم :
@ai_python
مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.
https://www.tamingllms.com/notebooks/input.html
@ai_python
مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.
https://www.tamingllms.com/notebooks/input.html
❤4❤🔥2🔥2
یکی از کتاب های مناسب برای مباحث پایه ریاضی مورد نیاز در علوم کامپیوتر
@ai_python
https://courses.csail.mit.edu/6.042/spring18/mcs.pdf
➕ Linear algebra
➕ Series
➕ Logic
➕ Probability
➕ Number theory
➕ Graphs
@ai_python
https://courses.csail.mit.edu/6.042/spring18/mcs.pdf
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤2❤🔥1
مدل های زبانی که در سال ۲۰۲۴ پر سر و صدا آمدند و بی سر و صدا رفتند :
@ai_python
https://analyticsindiamag.com/ai-trends/llms-that-failed-miserably-in-2024/
@ai_python
https://analyticsindiamag.com/ai-trends/llms-that-failed-miserably-in-2024/
Analytics India Magazine
LLMs that Failed Miserably in 2024
In 2024, the AI community witnessed the launch of several new large language models (LLMs), such as OpenAI’s o3 and Google Gemini 2, which promised to push the boundaries of what’s possible with AI.
❤🔥7
@ai_python
https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial
Perform semantic search and retrieval-augmented generation
👉 This tutorial guides you through the end-to-end process of creating and using text embeddings, including using vector indexes to improve search performance.
This tutorial covers the following tasks:
🖥 Creating a BigQuery ML remote model over a Vertex AI embedding model.
🖥 Using the remote model with the ML.GENERATE_EMBEDDING function to generate embeddings from text in a BigQuery table.
🖥 Creating a vector index to index the embeddings.
🖥 Using the VECTOR_SEARCH function with the embeddings to search for similar text.
🖥 Perform retrieval-augmented generation (RAG) by generating text with the ML.GENERATE_TEXT function, and using vector search results to augment the prompt input and improve results.
This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial
Perform semantic search and retrieval-augmented generation
This tutorial covers the following tasks:
This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥1
رویکردهایی برای افزایش دقت مدل های زبانی:
@ai_python
https://towardsdatascience.com/the-next-frontier-in-llm-accuracy-cb2491a740d4
@ai_python
https://towardsdatascience.com/the-next-frontier-in-llm-accuracy-cb2491a740d4
Medium
The Next Frontier in LLM Accuracy
Exploring the Power of Lamini Memory Tuning
❤🔥1
این ریپازیتوری گیت هاب به خصوص برای دوستانی که در زمینه IoT با تمرکز بر خانه های هوشمند فعالیت می کنند، احتمالن جالبه :
@ai_python
https://github.com/goruck/home-generative-agent
@ai_python
https://github.com/goruck/home-generative-agent
❤2❤🔥2🔥1
کتابخانه اوپن سورس BetterWhisperX که یک فورک بهبود یافته از WhisperX هست ، برای تشخیص صحبت به همراه دیاریزاسیون
@ai_python
https://github.com/federicotorrielli/BetterWhisperX
@ai_python
https://github.com/federicotorrielli/BetterWhisperX
❤3
یک پایپ لاین بسیار مناسب برای چانک کردن فایل های صوتی طولانی به طوری که برای کار با مدل های Whisper مربوط به Groq مناسب باشن :
@ai_python
https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb
Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:
@ai_python
👂 Preprocess audio files for optimal transcription
👂 Split audio files into manageable chunks
👂 Implement a smart overlap for our chunks
👂 Transcribe our chunks using Whisper Large V3
👂 Merge our results while properly handling overlaps
👂 Save our transcriptions in multiple formats for further handling
@ai_python
https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb
Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:
@ai_python
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
groq-api-cookbook/tutorials/audio-chunking/audio_chunking_tutorial.ipynb at main · groq/groq-api-cookbook
groq-api-cookbook. Contribute to groq/groq-api-cookbook development by creating an account on GitHub.
❤4❤🔥1🔥1