Telegram Web
@ai_python

قیمت های استفاده از API مربوط به Grok در آخرین روز سال 2024 و مدل های موجود.

قیمت های Completion و Text به ترتیب به ازای هر 1 میلیون توکن خروجی و ورودی هست.
🔥4
چند وقت پیش مایکروسافت از طریق اینفلوئنسرها، خیلی درباره امکان استفاده عمومی از پلت فرم تبدیل انواع فایل به مارک داون که فرمتی هست که به نظر می رسه مدل های زبانی بیش تر می پسندن به نام MarkItDown تبلیغ کرد.

@ai_python

الان ولی مدتی هست که کاربران از کیفیت بهتر عملکرد کتابخانه دیگه ای به نام docling در این خصوص می گن :

https://github.com/drmingler/docling-api

تجربه شما در این خصوص چی بوده؟
2
Forwarded from DLeX: AI Python (Amir)
📚 Mathematical Introduction to Deep Learning: Methods, Implementations, and Theory

🔗 https://arxiv.org/abs/2310.20360

#Books #DeepLearning

@ai_python
5
DLeX: AI Python
من الان فهمیدم این کتابخونه دومی که در این پست معرفی کردم و گفتم بعضیا اطلاع دادن، بهتر از MarkItDown مایکروسافت کار می کنه برای Parse ، حاصل کار IBM Research هست. :)
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
Please open Telegram to view this post
VIEW IN TELEGRAM
DLeX: AI Python
آماده سازی دیتای صفحات وب برای استفاده به عنوان clean markdown یا دیتای ساختاریافته در پایپ لاین های مختلف با یک Crawler اپن سورس : @ai_python https://github.com/mendableai/firecrawl
چند وقت پیش در این پست FireCrawl رو معرفی کردم. امروز یک Crawler دیگه هم پیدا کردم که به نظر می رسه جامعه توسعه دهنده های فعالی داره و از طرفی آخرین به روزسانی گیت هابش هم مربوط به همین دیروز هست.

@ai_python

اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.

ولی فعلن خودم هم این رو استفاده نکردم.

لینک گیت هاب :

https://github.com/unclecode/crawl4ai
8
Forwarded from Elon Fact فارسی
این ویدیو تمامن ساخته شده با Grok زیبا بود :

@elonfact

https://x.com/KatiaEarth/status/1874719053123862550
🔥4❤‍🔥11
DLeX: AI Python
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
در خصوص تفاوت نتیجه MarkItDown با docling ، این بررسی بسیار جامع و دقیق رو پیدا کردم :

@ai_python

مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.

https://www.tamingllms.com/notebooks/input.html
4❤‍🔥2🔥2
یکی از کتاب های مناسب برای مباحث پایه ریاضی مورد نیاز در علوم کامپیوتر

@ai_python

https://courses.csail.mit.edu/6.042/spring18/mcs.pdf


Linear algebra
Series
Logic
Probability
Number theory
Graphs
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥72❤‍🔥1
@ai_python

هر ری اکتی ، ری اکت نیست 🤪
Please open Telegram to view this post
VIEW IN TELEGRAM
7🐳2❤‍🔥1
@ai_python

https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial

Perform semantic search and retrieval-augmented generation

👉 This tutorial guides you through the end-to-end process of creating and using text embeddings, including using vector indexes to improve search performance.

This tutorial covers the following tasks:

🖥 Creating a BigQuery ML remote model over a Vertex AI embedding model.

🖥 Using the remote model with the ML.GENERATE_EMBEDDING function to generate embeddings from text in a BigQuery table.

🖥 Creating a vector index to index the embeddings.

🖥 Using the VECTOR_SEARCH function with the embeddings to search for similar text.

🖥 Perform retrieval-augmented generation (RAG) by generating text with the ML.GENERATE_TEXT function, and using vector search results to augment the prompt input and improve results.

This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1
این ریپازیتوری گیت هاب به خصوص برای دوستانی که در زمینه IoT با تمرکز بر خانه های هوشمند فعالیت می کنند، احتمالن جالبه :

@ai_python

https://github.com/goruck/home-generative-agent
2❤‍🔥2🔥1
@ai_python

لاوبل اینا هم از فایرکراول استفاده می کنن 🥹
Please open Telegram to view this post
VIEW IN TELEGRAM
4
کتابخانه اوپن سورس BetterWhisperX که یک فورک بهبود یافته از WhisperX هست ، برای تشخیص صحبت به همراه دیاریزاسیون

@ai_python

https://github.com/federicotorrielli/BetterWhisperX
3
@ai_python

اینتگریشن های تازه LangChain در ماهی که گذشت
❤‍🔥41🔥1
یک پایپ لاین بسیار مناسب برای چانک کردن فایل های صوتی طولانی به طوری که برای کار با مدل های Whisper مربوط به Groq مناسب باشن :

@ai_python

https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb


Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:

@ai_python

👂 Preprocess audio files for optimal transcription
👂 Split audio files into manageable chunks
👂 Implement a smart overlap for our chunks
👂 Transcribe our chunks using Whisper Large V3
👂 Merge our results while properly handling overlaps
👂 Save our transcriptions in multiple formats for further handling
Please open Telegram to view this post
VIEW IN TELEGRAM
4❤‍🔥1🔥1
2025/07/12 22:43:20
Back to Top
HTML Embed Code: