Telegram Web
DLeX: AI Python
آماده سازی دیتای صفحات وب برای استفاده به عنوان clean markdown یا دیتای ساختاریافته در پایپ لاین های مختلف با یک Crawler اپن سورس : @ai_python https://github.com/mendableai/firecrawl
چند وقت پیش در این پست FireCrawl رو معرفی کردم. امروز یک Crawler دیگه هم پیدا کردم که به نظر می رسه جامعه توسعه دهنده های فعالی داره و از طرفی آخرین به روزسانی گیت هابش هم مربوط به همین دیروز هست.

@ai_python

اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.

ولی فعلن خودم هم این رو استفاده نکردم.

لینک گیت هاب :

https://github.com/unclecode/crawl4ai
8
Forwarded from Elon Fact فارسی
این ویدیو تمامن ساخته شده با Grok زیبا بود :

@elonfact

https://x.com/KatiaEarth/status/1874719053123862550
🔥4❤‍🔥11
DLeX: AI Python
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
در خصوص تفاوت نتیجه MarkItDown با docling ، این بررسی بسیار جامع و دقیق رو پیدا کردم :

@ai_python

مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.

https://www.tamingllms.com/notebooks/input.html
4❤‍🔥2🔥2
یکی از کتاب های مناسب برای مباحث پایه ریاضی مورد نیاز در علوم کامپیوتر

@ai_python

https://courses.csail.mit.edu/6.042/spring18/mcs.pdf


Linear algebra
Series
Logic
Probability
Number theory
Graphs
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥72❤‍🔥1
@ai_python

هر ری اکتی ، ری اکت نیست 🤪
Please open Telegram to view this post
VIEW IN TELEGRAM
7🐳2❤‍🔥1
@ai_python

https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial

Perform semantic search and retrieval-augmented generation

👉 This tutorial guides you through the end-to-end process of creating and using text embeddings, including using vector indexes to improve search performance.

This tutorial covers the following tasks:

🖥 Creating a BigQuery ML remote model over a Vertex AI embedding model.

🖥 Using the remote model with the ML.GENERATE_EMBEDDING function to generate embeddings from text in a BigQuery table.

🖥 Creating a vector index to index the embeddings.

🖥 Using the VECTOR_SEARCH function with the embeddings to search for similar text.

🖥 Perform retrieval-augmented generation (RAG) by generating text with the ML.GENERATE_TEXT function, and using vector search results to augment the prompt input and improve results.

This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1
این ریپازیتوری گیت هاب به خصوص برای دوستانی که در زمینه IoT با تمرکز بر خانه های هوشمند فعالیت می کنند، احتمالن جالبه :

@ai_python

https://github.com/goruck/home-generative-agent
2❤‍🔥2🔥1
@ai_python

لاوبل اینا هم از فایرکراول استفاده می کنن 🥹
Please open Telegram to view this post
VIEW IN TELEGRAM
4
کتابخانه اوپن سورس BetterWhisperX که یک فورک بهبود یافته از WhisperX هست ، برای تشخیص صحبت به همراه دیاریزاسیون

@ai_python

https://github.com/federicotorrielli/BetterWhisperX
3
@ai_python

اینتگریشن های تازه LangChain در ماهی که گذشت
❤‍🔥41🔥1
یک پایپ لاین بسیار مناسب برای چانک کردن فایل های صوتی طولانی به طوری که برای کار با مدل های Whisper مربوط به Groq مناسب باشن :

@ai_python

https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb


Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:

@ai_python

👂 Preprocess audio files for optimal transcription
👂 Split audio files into manageable chunks
👂 Implement a smart overlap for our chunks
👂 Transcribe our chunks using Whisper Large V3
👂 Merge our results while properly handling overlaps
👂 Save our transcriptions in multiple formats for further handling
Please open Telegram to view this post
VIEW IN TELEGRAM
4❤‍🔥1🔥1
جای پلت فرم هایی که تصاویر وکتوری از پرامپ های ما تولید کنن یه مقدار خالی بود. ( در مقابل تصاویر پیکسلی ) :

@ai_python

https://github.com/SagiPolaczek/NeuralSVG
6❤‍🔥4🔥2
مدل TimesFM یکی از مدل های پیش بینی Time Series هست که توسط گوگل توسعه داده شده است. این مدل در Hugging Face نیز در دسترس قرار دارد :

@ai_python

https://huggingface.co/google/timesfm-2.0-500m-pytorch

مقاله های مرتبط :

🔗 https://arxiv.org/abs/2310.10688

🔗 https://arxiv.org/abs/2402.02592
Please open Telegram to view this post
VIEW IN TELEGRAM
10❤‍🔥2🔥2
اولین جلسه یکی از کورس های ماشین لرنینگ پیشرفته در شبکه اجتماعی X :
@ai_python

https://x.com/randallmbriggs/status/1877675613441396800

به نظرم خیلی عالیه که از ظرفیت های این شبکه برای انتشار کورس ها استفاده بشه. چون دنبال کردن کامنت ها و ارتباط گرفتن با آموزش دهنده ها در توییتر بسیار راحت تر از یوتیوب هست.
🔥5❤‍🔥22🐳1
از اونجایی که این ریپازیتوری گیت هاب حاوی لینک به برخی از بهترین منابع آموزشی هوش مصنوعی بعد از این همه سال هنوزم به روزرسانی می شه و هنوزم خوبه ، لازم دونستم یه بار دیگه توی کانال معرفیش کنم :

@ai_python

https://github.com/owainlewis/awesome-artificial-intelligence
❤‍🔥43🔥1
2025/07/08 17:57:02
Back to Top
HTML Embed Code: