在路上:语义和创业

 
郑昀@玩聚网之宝聚 2008-02-28

1:
我常说,语义技术将像ajax一样成为开发者必备技能。
但能把ajax玩得像gmail那么转而且早的,一定不多。
玩个自动提取标签啦之类的都是小case。
将来一般网站都应该掌握的。

语义技术,无非分词、词性标注、分类。如果有几个开源的东西一拼接就行了。
如果等你打算做到百度新闻的领域,就会意识到算法是核心竞争力。

比如这次改版后的百度新闻,那就必须揉合多种算法,而且必须从本质做大的提升。姑且不说强度很高的文本相似性算法,就说分类,必须提升现在常见的分类算法。因为它分类分得非常细。
这时候,必须自己研发。
单纯就百度新闻的互联网频道,就好几个子类。十几个大频道,每个都有各种各样很细小的分类,语言
特征很模糊。
我问过他们,这都是机器自动的,几乎接近于传统媒体网站一大堆编辑的水平了,语义能到这种可商用
的强度就难了。

算法不是一朝一夕能偷师的。
所以,技术门槛还是比较高的。

随着语义技术普及,那么势必有一些应用要求接近于人工智能,此时算法很重要。
所以,要把底子打好,以备来日激战。
当然,有的时候,统计+规则+简单语法分析能解决不少问题,比如说中国雅虎的人际关系计算,不需要
太强力的算法,却又能得到良好的效果。

2:
单纯一个盘子,有时太小,主要是抗风险能力小。
所以,每个公司选择了不同的道路。(同归却殊途,有另外一种解释,今天看到的这个:马化腾:QQ和
Facbook会殊途同归。)
有时取决于随机的一些选择。
有时取决于某个人的历史经验。
比较难的是,保持一个战略,坚定地走上两年三年。
因为事在变,人在变,市场在变,对手在变。

3:
第一,你要提前预测到市场,乃为先知是也;
第二,预测到大公司不会立刻进入这个市场,乃为风险管理;
第三,构筑技术壁垒,不是为了防范大公司,那不可能,而是保证你以后有足够的谈判砝码;
第四,积极拉拢各种资源,跑马圈地;
第五,看能不能抵抗大公司的侵入,或者与大公司一起防止第三方侵入。
不过我觉得在中国这些事儿都悬,说什么都没用,只能执行。

原文地址:https://www.cnblogs.com/zhengyun_ustc/p/1085582.html