Telegram Web
DLeX: AI Python
آماده سازی دیتای صفحات وب برای استفاده به عنوان clean markdown یا دیتای ساختاریافته در پایپ لاین های مختلف با یک Crawler اپن سورس : @ai_python https://github.com/mendableai/firecrawl
چند وقت پیش در این پست FireCrawl رو معرفی کردم. امروز یک Crawler دیگه هم پیدا کردم که به نظر می رسه جامعه توسعه دهنده های فعالی داره و از طرفی آخرین به روزسانی گیت هابش هم مربوط به همین دیروز هست.

@ai_python

اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.

ولی فعلن خودم هم این رو استفاده نکردم.

لینک گیت هاب :

https://github.com/unclecode/crawl4ai
Forwarded from Elon Fact فارسی
این ویدیو تمامن ساخته شده با Grok زیبا بود :

@elonfact

https://x.com/KatiaEarth/status/1874719053123862550
DLeX: AI Python
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
در خصوص تفاوت نتیجه MarkItDown با docling ، این بررسی بسیار جامع و دقیق رو پیدا کردم :

@ai_python

مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.

https://www.tamingllms.com/notebooks/input.html
یکی از کتاب های مناسب برای مباحث پایه ریاضی مورد نیاز در علوم کامپیوتر

@ai_python

https://courses.csail.mit.edu/6.042/spring18/mcs.pdf


Linear algebra
Series
Logic
Probability
Number theory
Graphs
Please open Telegram to view this post
VIEW IN TELEGRAM
@ai_python

هر ری اکتی ، ری اکت نیست 🤪
Please open Telegram to view this post
VIEW IN TELEGRAM
@ai_python

https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial

Perform semantic search and retrieval-augmented generation

👉 This tutorial guides you through the end-to-end process of creating and using text embeddings, including using vector indexes to improve search performance.

This tutorial covers the following tasks:

🖥 Creating a BigQuery ML remote model over a Vertex AI embedding model.

🖥 Using the remote model with the ML.GENERATE_EMBEDDING function to generate embeddings from text in a BigQuery table.

🖥 Creating a vector index to index the embeddings.

🖥 Using the VECTOR_SEARCH function with the embeddings to search for similar text.

🖥 Perform retrieval-augmented generation (RAG) by generating text with the ML.GENERATE_TEXT function, and using vector search results to augment the prompt input and improve results.

This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
Please open Telegram to view this post
VIEW IN TELEGRAM
این ریپازیتوری گیت هاب به خصوص برای دوستانی که در زمینه IoT با تمرکز بر خانه های هوشمند فعالیت می کنند، احتمالن جالبه :

@ai_python

https://github.com/goruck/home-generative-agent
@ai_python

لاوبل اینا هم از فایرکراول استفاده می کنن 🥹
Please open Telegram to view this post
VIEW IN TELEGRAM
کتابخانه اوپن سورس BetterWhisperX که یک فورک بهبود یافته از WhisperX هست ، برای تشخیص صحبت به همراه دیاریزاسیون

@ai_python

https://github.com/federicotorrielli/BetterWhisperX
@ai_python

اینتگریشن های تازه LangChain در ماهی که گذشت
یک پایپ لاین بسیار مناسب برای چانک کردن فایل های صوتی طولانی به طوری که برای کار با مدل های Whisper مربوط به Groq مناسب باشن :

@ai_python

https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb


Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:

@ai_python

👂 Preprocess audio files for optimal transcription
👂 Split audio files into manageable chunks
👂 Implement a smart overlap for our chunks
👂 Transcribe our chunks using Whisper Large V3
👂 Merge our results while properly handling overlaps
👂 Save our transcriptions in multiple formats for further handling
Please open Telegram to view this post
VIEW IN TELEGRAM
جای پلت فرم هایی که تصاویر وکتوری از پرامپ های ما تولید کنن یه مقدار خالی بود. ( در مقابل تصاویر پیکسلی ) :

@ai_python

https://github.com/SagiPolaczek/NeuralSVG
مدل TimesFM یکی از مدل های پیش بینی Time Series هست که توسط گوگل توسعه داده شده است. این مدل در Hugging Face نیز در دسترس قرار دارد :

@ai_python

https://huggingface.co/google/timesfm-2.0-500m-pytorch

مقاله های مرتبط :

🔗 https://arxiv.org/abs/2310.10688

🔗 https://arxiv.org/abs/2402.02592
Please open Telegram to view this post
VIEW IN TELEGRAM
اولین جلسه یکی از کورس های ماشین لرنینگ پیشرفته در شبکه اجتماعی X :
@ai_python

https://x.com/randallmbriggs/status/1877675613441396800

به نظرم خیلی عالیه که از ظرفیت های این شبکه برای انتشار کورس ها استفاده بشه. چون دنبال کردن کامنت ها و ارتباط گرفتن با آموزش دهنده ها در توییتر بسیار راحت تر از یوتیوب هست.
از اونجایی که این ریپازیتوری گیت هاب حاوی لینک به برخی از بهترین منابع آموزشی هوش مصنوعی بعد از این همه سال هنوزم به روزرسانی می شه و هنوزم خوبه ، لازم دونستم یه بار دیگه توی کانال معرفیش کنم :

@ai_python

https://github.com/owainlewis/awesome-artificial-intelligence
2025/07/08 10:00:37
Back to Top
HTML Embed Code: