博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【语义未来】Twine和Scoutlabs揭示的冰山一角
阅读量:7207 次
发布时间:2019-06-29

本文共 2375 字,大约阅读时间需要 7 分钟。

早先提醒我注意这家叫Radar Networks的公司,说是语义世界中不得不重视的角儿。可角儿总是只听楼梯响不见人下来,就像啥也没见着就第一轮融资1250万美金的,打着自然语言搜索引擎的大旗N久,也只是917宣布可以在申请测试。

   据的测评,还并不是真的输入自然的语句到搜索框,而是按照设定好的“填空式”提问,比如who criticized (president bush)? 如:who beat/defeat ()? 。。。小i也成功地给投资人画了一张自然语言智能机器人的大饼,成功融资2000万美金。联想到不久前见的一个投资人,对我们的不置可否,但却问我们能不能做语义搜索,寒,只能说这一定是下一个投资大热门,做好了估计能比265还高价地卖给谷歌。

,不过还是琵琶半遮面,我们可以在后面附录里看到一系列的截图,看上去有点美。流传最多的两篇文章:,把这个事儿描述得天花乱坠。对于Twine语义分析用户的各种信息,为每一个文档、视频或照片创建标签,Twine所作的就是产生智能标签并将它们联系起来;这个从语义技术上就是实体识别,最多加上一个自动分类,也就是根据自动分类判断当下这个信息流属于哪一个领域,以防止那些易歧义的实体名称被误判。比这个再难一点的是,经过训练的Twine可以迅速“理解”含义模糊的词组:它可根据上下文来判断J.P.摩根是人名还是一家公司的名字;如何做到呢,这实际是语言的自动理解(Language Understanding),即从句子表层的词语符号串识别句子的句法结构,判断成分之间的语义关系,不过应该蛮消耗服务器资源的。

    其实雅虎的就是一个典型应用,国外的daylife也用类似的技术打造了一个概念“Connections Engine”,并用一个无与伦比蔚为壮观的展现,充分传达了它的实体关联引擎的强悍。至于我们怎么玩这个的,我在,不难,在这个热点故事里,你可以在右侧看到Connections Engine的自动关联实例。

Twine并不仅仅是把无序碎片有序化并关联从而形成语义图,它还计入了Social的智慧,如果你与其他用户有共享关系,那么所有内容都与添加人联系着;当你进行搜索时,返回的结果不只是受到标签的影响,还受到最先添加内容人的影响。这个人与你的联系愈紧密,受到的影响就愈大。

   是不是看到了swicki、豆瓣的一些理念和元素?寒的是,我们的努力都暂时局限在了语义的research上,而没有social的元素,比如热点 ,比如

我以前喜欢打击语义搜索,总觉得自然语言搜索既没强烈需求又难研发,一两千万都容易打水漂,但是Radar却想到了这样的Twine模式避免了纯做搜索的问题,用一定级别的语义分析,再加上他们的Social概念,搞出一个逼近Web3.0的社区来

至于中夸耀的“更令人叫绝的是,给Twine一段文字,它能利用机器学习能力,在维基百科一类的词海中寻找匹配的信息,总结出这段文字的主题甚至概括中心思想”。这是自然语言处理的另一个主要核心问题:自动生成(Language Generation),即从要表达的意思出发选择词语,根据词语间的语义关系构造各个成分之间的语义结构和句法结构,最终造出符合语法和逻辑的句子。说白了就是“自动提取摘要”技术。

RadatCEO斯皮沃克说,人们研究了几十年的“人工智能”、“自然语言处理”,而今天,人们把这些研究成果运用在语义网络上,让这张网变成智能网络,能“看明白”人类的自然语言。

这其实和我们在上下的功夫是异曲同工的,我们也常说要让机器象普通股民看股评或财经资讯一样去理解这些知识碎片,比如“理解”各方(股票论坛、财经博客、专家、机构)对后市走势的看法,“理解”专家和机构的短线、中线和长线的操作建议,等等,能够衍生出很多实在的应用,我们也是刚玩没几天。

提及了网络口碑(IWOM)先行者,从下面的评论可以看出,光是scout labs放出来的就搞得大家齐唱赞歌。光看deom的话(又是邀请制),有几个特点:

1Sentiment Trend图,象大旗口碑榜一样,但比口碑榜多了一个时间维度,就是每天口碑是如何变化的。大旗应该也可以有同样的效果。但这就看判断正反面意见的功力了,必须真的在语义上真刀真枪,要准确判断。大旗还是习惯性地在BD上下功夫,Research上没太大长进,他们计算的对某一款产品的正面、负面和中性意见还是略显粗糙。大旗的网友经验快速分享,能迅速指出某一款产品的三个优点和三个缺点,如果是机器自动算出来的话,还是很厉害的,如果是人工,哦也,那就另当别论了。

2:提到iPhone的同时还提到哪些关键词。更有用的是,和竞争对手进行横向比较。

3:它能判断哪些言论最有影响力、最重要,值得厂家去重视和回馈;这个需要social指标,确实不是太容易量化。

国内的CIC也是做IWOM的,两天前在blog上说刚拿到战略投资。

 

小结:

语义这东西,有趣,好玩,起码门槛有点高,没有个三五年的积累,不容易摸着门儿。玩得好,玩到语义搜索的境界,那就玩大了,可以入谷歌百度的法眼了。在IWOM/口碑上玩,也有很多可玩的,据说,“深不可测”。在上,也有一定的想象空间。

 

语义和TWINE的相关链接:

·                     

·                     

·                     

·                     Watch the Video of the Twine demo at the Web 2.0 Summit! (Twine is the third demo after Freebase and Powerset)  | 

·                     

·                     

·                     

·                     

·                     

·                     

·                     

·                     

·                     

·                     

·                     

 

twine内测系统截图:

 

 
 
 
 
 

我的最近文章:

12/07/2007

12/05/2007
12/01/2007  
11/30/2007 
11/27/2007 

转载地址:http://rcvum.baihongyu.com/

你可能感兴趣的文章
linux svn启动和关闭(转)
查看>>
Hadoop序列化与Java序列化
查看>>
Java Machine Learning Tools & Libraries--转载
查看>>
BZOJ 1199: [HNOI2005]汤姆的游戏 计算几何暴力
查看>>
spring mvc 请求转发和重定向
查看>>
PID控制器(比例-积分-微分控制器)- II
查看>>
android.graphics包中的一些类的使用
查看>>
将Ojective-C代码移植转换为Swift代码
查看>>
C#控制台程序取得INSOYA视频区的视频的真实URL,视频标题,发布时间集合。
查看>>
从控制台读取password - C#
查看>>
高通公司 MSM8K GPT异常原因分析无法开机的问题
查看>>
Android 升级下载 它们的定义Updates 兼容版本
查看>>
webstorm 10.0.4 注册码
查看>>
跨平台开源通讯组件elastic communication
查看>>
js dom学习
查看>>
Project Euler 98:Anagramic squares 重排平方数
查看>>
懒与馋的平衡:餐饮O2O市场广阔,发展不易
查看>>
Ubuntu下安装中文输入法
查看>>
(原)使用vectot的.end()报错:iterators incompatible
查看>>
通用软部件(通用管理信息系统)的研究与生产
查看>>