Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
10993 - Telegram Web
Telegram Web
学了100小时后,我才发学习MCP的最佳方式是这个!_哔哩哔哩_bilibili

学MCP的最佳方式是:自己开发一个...

这次和阿里的魔搭社区合作,用魔搭社区上提供的免费模型API做了个可以让Cursor等AI IDE生成图片并且给网站、文章配图的MCP。

MCP配置方式如下:
{
"mcpServers": {
"ai-image-generator": {
"command": "npx",
"args": ["@alchain/mcp-flux-web-image-generator@latest"],
"env": {
"MODELSCOPE_API_KEY": "your-modelscope-api-key-here"
}
}
}
}

API key可以通过这个链接获取:https://modelscope.cn/my/myaccesstoken
👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Dia 浏览器发布了这周更新的功能,除了储值侧边栏以外还有:#ai创造营#

- 将标签页拖入分屏视图,即可清晰查看左右两侧的目标。
- 拖动地址栏中未使用的部分即可移动浏览器窗口。
- 选项卡、文件和附件可在自定义技能菜单中提及。
1👎1
Huggingface 发布 SmolLM3 3B LLM#ai创造营#

性能上超越 Llama-3.2-3B 和 Qwen2.5-3B,同时与更大的 4B 模型 Gemma3 持平

除了开源模型本身外,还开源了使用公共数据集和训练框架训练模型的方法

- 3B 模型在 11T Toekn 上训练
- 具备双模式推理的指令模型
-支持 6 种语言的多语言
- 最长支持 128K 上下文

架构与训练细节

采用 Transformer 解码器架构,基于 Llama 并做了多项优化:
Grouped Query Attention (GQA): 替换多头注意力,减少推理时 KV cache 占用。
NoPE: 部分层移除旋转位置编码,提升长上下文表现。
Intra-Document Masking: 保证同一序列不同文档间不可互相注意,提升训练稳定性。
Embedding 层无权重衰减: 参考 OLMo 2,提升训练稳定性。
训练配置:2.36M tokens 全局 batch,序列长度 4096,AdamW 优化器,24 天内用 384 张 H100 GPU 训练。

数据混合与多阶段训练

采用三阶段训练策略,逐步调整 Web、代码、数学数据比例,总计训练 11.2T tokens。
阶段 1:以 Web 数据为主,奠定基础能力。
阶段 2:提升高质量数学和代码数据比例。
阶段 3:进一步提升数学和代码数据占比,加入推理数据。
训练后期进行“mid-training”,分别针对长上下文和推理能力做短期训练。

长上下文与推理能力提升

长上下文扩展:通过两阶段训练将上下文窗口从 4k 扩展到 64k,并用 YARN 技术在推理时支持到 128k。
推理 mid-training:用 35B tokens 的推理数据(如 OpenThoughts3-1.2M、Llama-Nemotron 数据集)提升通用推理能力。

后训练与模型对齐

采用双模式 chat 模板,用户可通过 `/think`(推理)和 `/no_think`(非推理)切换模式。
支持工具调用(XML/Python 工具)。
SFT 阶段用 1.8B tokens 进行监督微调,平衡推理与非推理能力。
用 Anchored Preference Optimization (APO) 进行偏好对齐,提升模型输出质量。
1
Forwarded from 🚩508🚩娱乐
This media is not supported in your browser
VIEW IN TELEGRAM
👫东南亚最有实力的娱乐平台👫
🤑首存赠送50%
🤑二存三存赠送30%
🤕实力品牌🤕值得信任🤕用户至上🤕口碑见证🤕

😆新会员好礼大赠送😆
🧜‍♀️充值最高赠送8888🤪🫠🫨
🙇‍♀️每日盈利亏损大赠送
🥷APP每日红包不停
🧞‍♀️次次存次次送
👨‍🎨代理返佣高达65%
👨‍🎓更多优惠活动联系24小时在线客服

🫣USDT注册入口:508133.com
🫣人民币注册入口:508155.com

☺️☺️😊😇🙂🙃😇508.com
😀😃😄😁🥹🤣@xinpujing6Bot
😊🥰😊🙂😉😍@usdt508166
🤪🤨😗😚😎🥸@zs508
😏🙂‍↔️😎🙁😡😒@eth508
😰🤬🥶🫢😠🥵@BNB508166Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
当红炸子鸡
“全球首播”🤣
我们是懂造概念的
毕竟已经成为了“机器人第一股”

这效率能比AMR/AGV/复合 高?
十年内应该没有这个可能性

这条留在这里
看看哪年回来打我的脸
💩1
Reddit 有个老哥尝试用 Wan 2.1 视频模型生成图片

结果看起来质量非常高,默认的图像质量比很多专门的图像模型都好

所有图像都是直出的 1080P 分辨率,4090 一张图大概 42 秒

在 beta 和 ddim_uniform 调度器上会呈现不同质感,他还分享了工作流

工作流和更多细节在这里:reddit.com/r/StableDiffusion/comments/1lu7nxx/wan_21_txt2img_is_amazing/
Gemini 3.0 要来了?#ai创造营#

真要最近能发布的话,谷歌真要无人能敌了

来源:x.com/skizoexe/status/1942704776183177716
2025/07/13 22:48:46
Back to Top
HTML Embed Code: