DLeX: AI Python
آماده سازی دیتای صفحات وب برای استفاده به عنوان clean markdown یا دیتای ساختاریافته در پایپ لاین های مختلف با یک Crawler اپن سورس : @ai_python https://github.com/mendableai/firecrawl
چند وقت پیش در این پست FireCrawl رو معرفی کردم. امروز یک Crawler دیگه هم پیدا کردم که به نظر می رسه جامعه توسعه دهنده های فعالی داره و از طرفی آخرین به روزسانی گیت هابش هم مربوط به همین دیروز هست.
@ai_python
اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.
ولی فعلن خودم هم این رو استفاده نکردم.
لینک گیت هاب :
https://github.com/unclecode/crawl4ai
@ai_python
اسم این یکی Crawl4AI هست که اسمش گویای هدف اصلی هست. اگر تونستم بعدن اطلاعات تکمیلی و خوبی ها یا بدی هاش رو نسبت به FireCrawl می گم.
ولی فعلن خودم هم این رو استفاده نکردم.
لینک گیت هاب :
https://github.com/unclecode/crawl4ai
❤8
Forwarded from Elon Fact فارسی
این ویدیو تمامن ساخته شده با Grok زیبا بود :
@elonfact
https://x.com/KatiaEarth/status/1874719053123862550
@elonfact
https://x.com/KatiaEarth/status/1874719053123862550
🔥4❤🔥1❤1
DLeX: AI Python
ظاهرن یکی از برتری های فعلی docling نسبت به MarkItDown اینه که داکلینگ توی LlamaIndex و LangChain هم Integrate شده 🔗
در خصوص تفاوت نتیجه MarkItDown با docling ، این بررسی بسیار جامع و دقیق رو پیدا کردم :
@ai_python
مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.
https://www.tamingllms.com/notebooks/input.html
@ai_python
مرحله به مرحله از هر لحاظ که فکرشو بکنید مقایسه کرده.
https://www.tamingllms.com/notebooks/input.html
❤4❤🔥2🔥2
یکی از کتاب های مناسب برای مباحث پایه ریاضی مورد نیاز در علوم کامپیوتر
@ai_python
https://courses.csail.mit.edu/6.042/spring18/mcs.pdf
➕ Linear algebra
➕ Series
➕ Logic
➕ Probability
➕ Number theory
➕ Graphs
@ai_python
https://courses.csail.mit.edu/6.042/spring18/mcs.pdf
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤2❤🔥1
مدل های زبانی که در سال ۲۰۲۴ پر سر و صدا آمدند و بی سر و صدا رفتند :
@ai_python
https://analyticsindiamag.com/ai-trends/llms-that-failed-miserably-in-2024/
@ai_python
https://analyticsindiamag.com/ai-trends/llms-that-failed-miserably-in-2024/
Analytics India Magazine
LLMs that Failed Miserably in 2024
In 2024, the AI community witnessed the launch of several new large language models (LLMs), such as OpenAI’s o3 and Google Gemini 2, which promised to push the boundaries of what’s possible with AI.
❤🔥7
@ai_python
https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial
Perform semantic search and retrieval-augmented generation
👉 This tutorial guides you through the end-to-end process of creating and using text embeddings, including using vector indexes to improve search performance.
This tutorial covers the following tasks:
🖥 Creating a BigQuery ML remote model over a Vertex AI embedding model.
🖥 Using the remote model with the ML.GENERATE_EMBEDDING function to generate embeddings from text in a BigQuery table.
🖥 Creating a vector index to index the embeddings.
🖥 Using the VECTOR_SEARCH function with the embeddings to search for similar text.
🖥 Perform retrieval-augmented generation (RAG) by generating text with the ML.GENERATE_TEXT function, and using vector search results to augment the prompt input and improve results.
This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
https://cloud.google.com/bigquery/docs/vector-index-text-search-tutorial
Perform semantic search and retrieval-augmented generation
This tutorial covers the following tasks:
This tutorial uses the BigQuery public table patents-public-data.google_patents_research.publications.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥1
رویکردهایی برای افزایش دقت مدل های زبانی:
@ai_python
https://towardsdatascience.com/the-next-frontier-in-llm-accuracy-cb2491a740d4
@ai_python
https://towardsdatascience.com/the-next-frontier-in-llm-accuracy-cb2491a740d4
Medium
The Next Frontier in LLM Accuracy
Exploring the Power of Lamini Memory Tuning
❤🔥1
این ریپازیتوری گیت هاب به خصوص برای دوستانی که در زمینه IoT با تمرکز بر خانه های هوشمند فعالیت می کنند، احتمالن جالبه :
@ai_python
https://github.com/goruck/home-generative-agent
@ai_python
https://github.com/goruck/home-generative-agent
❤2❤🔥2🔥1
کتابخانه اوپن سورس BetterWhisperX که یک فورک بهبود یافته از WhisperX هست ، برای تشخیص صحبت به همراه دیاریزاسیون
@ai_python
https://github.com/federicotorrielli/BetterWhisperX
@ai_python
https://github.com/federicotorrielli/BetterWhisperX
❤3
یک پایپ لاین بسیار مناسب برای چانک کردن فایل های صوتی طولانی به طوری که برای کار با مدل های Whisper مربوط به Groq مناسب باشن :
@ai_python
https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb
Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:
@ai_python
👂 Preprocess audio files for optimal transcription
👂 Split audio files into manageable chunks
👂 Implement a smart overlap for our chunks
👂 Transcribe our chunks using Whisper Large V3
👂 Merge our results while properly handling overlaps
👂 Save our transcriptions in multiple formats for further handling
@ai_python
https://github.com/groq/groq-api-cookbook/blob/main/tutorials/audio-chunking/audio_chunking_tutorial.ipynb
Groq is great for processing long audio files thanks to its fast inference speeds and even hours of audio that we process into chunks can be transcribed in a matter of minutes. As such, we'll use Whisper Large V3 powered by Groq and learn how to:
@ai_python
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
groq-api-cookbook/tutorials/audio-chunking/audio_chunking_tutorial.ipynb at main · groq/groq-api-cookbook
groq-api-cookbook. Contribute to groq/groq-api-cookbook development by creating an account on GitHub.
❤4❤🔥1🔥1
جای پلت فرم هایی که تصاویر وکتوری از پرامپ های ما تولید کنن یه مقدار خالی بود. ( در مقابل تصاویر پیکسلی ) :
@ai_python
https://github.com/SagiPolaczek/NeuralSVG
@ai_python
https://github.com/SagiPolaczek/NeuralSVG
❤6❤🔥4🔥2
مدل TimesFM یکی از مدل های پیش بینی Time Series هست که توسط گوگل توسعه داده شده است. این مدل در Hugging Face نیز در دسترس قرار دارد :
@ai_python
https://huggingface.co/google/timesfm-2.0-500m-pytorch
مقاله های مرتبط :
🔗 https://arxiv.org/abs/2310.10688
🔗 https://arxiv.org/abs/2402.02592
@ai_python
https://huggingface.co/google/timesfm-2.0-500m-pytorch
مقاله های مرتبط :
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
google/timesfm-2.0-500m-pytorch · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤10❤🔥2🔥2
اولین جلسه یکی از کورس های ماشین لرنینگ پیشرفته در شبکه اجتماعی X :
@ai_python
https://x.com/randallmbriggs/status/1877675613441396800
به نظرم خیلی عالیه که از ظرفیت های این شبکه برای انتشار کورس ها استفاده بشه. چون دنبال کردن کامنت ها و ارتباط گرفتن با آموزش دهنده ها در توییتر بسیار راحت تر از یوتیوب هست.
@ai_python
https://x.com/randallmbriggs/status/1877675613441396800
به نظرم خیلی عالیه که از ظرفیت های این شبکه برای انتشار کورس ها استفاده بشه. چون دنبال کردن کامنت ها و ارتباط گرفتن با آموزش دهنده ها در توییتر بسیار راحت تر از یوتیوب هست.
🔥5❤🔥2❤2🐳1
از اونجایی که این ریپازیتوری گیت هاب حاوی لینک به برخی از بهترین منابع آموزشی هوش مصنوعی بعد از این همه سال هنوزم به روزرسانی می شه و هنوزم خوبه ، لازم دونستم یه بار دیگه توی کانال معرفیش کنم :
@ai_python
https://github.com/owainlewis/awesome-artificial-intelligence
@ai_python
https://github.com/owainlewis/awesome-artificial-intelligence
❤🔥4❤3🔥1
پایپ لاین تحلیل سهام با کمک LangGraph و مدل GPT-4 :
@ai_python
https://abhinavk910.medium.com/building-an-agentic-financial-analyst-with-langgraph-and-openai-5138192c9783
@ai_python
https://abhinavk910.medium.com/building-an-agentic-financial-analyst-with-langgraph-and-openai-5138192c9783
Medium
Building an Agentic Financial Analyst with LangGraph and OpenAI
In the world of stock trading, investors rely on various tools and methods to make informed decisions. One such approach is fundamental…
❤3❤🔥1🥰1