tgoop.com/dps_build/409
Create:
Last Update:
Last Update:
这个完全是外行话了,归因错误:大家不愿开发小众语言的相关工具最主要的原因不是赚不到钱,而是成本太高:
1. 没有足够的样本数据
2. 没有相关的工具链
以阿拉伯语为例吧,使用人群够大了吧?但是阿语的口语没有统一,基本上每个地区都有自己的口音/用法。比如阿联酋就有自己的 emirate accent,而说这个口音的人只有一两百万,搜集口语数据非常困难,更不用说更小众的语言。
再说工具链,搜搜 github 上,英语的 NLP 工具有多少?中文的 NLP 工具有多少?阿语的呢?几个最简单的例子,中文的分词一直是一个很大的问题,我们现在有多少开源工具可以拿来用?阿语有同样的分词问题,可用工具少得可怜。
连研发都谈不上,就根本不用谈再往后的产品化。赚不到是一个原因,但绝对不是主要原因。
https://overcast.fm/+AA67ml3takc
BY DPS Build
Share with your friend now:
tgoop.com/dps_build/409