下面我想解释一下 Google 如何确定来源或实体的可信度、可信度和权威性的一些方法。
情绪分析作为信任评估的一种方法
情感分析用于评估一个句子或一段文本的情绪。从Google的NLP API可以看出,Google能够进行情感分析。情感分析和实体分析是自然语言处理中的核心子步骤。通过这种方式,谷歌可以分析提及实体、公司和人时所包含的情绪。如果该实体在负面语境中被频繁提及,则它看起来不可信,反之亦然。评论和评级尤其可以成为此类分析的有趣来源。
通过 Google NLP API 进行情绪分析的示例,来源:digitale-wunderwelt.de
以下是Google NLP API 文档的摘录:
实体情绪分析将实体分析与情绪分析相结合,试图识别文本实体中表达的态度(积极或消极)。每个实体情绪都由数值分数和量级值表示,并针对实体的每次提及确定。然后将这些分数汇总为一个实体的整体情绪分数(分数和幅度)...
自然语言 API 处理给定的文本以提取实体并确定情感。对每个实体的情绪分析的请求将返回一个响应,其中包含、 实体的每个提及entities的条目 以及 每个提及 的 和的 mentions 数值 ,如解释情绪分析值中所述 。实体的和 值 是对该实体每次提及的具体和 值的总结 。对于一个实体, 和 值 可以 是,如果文本中的情感产生较低的值, 导致分数为 0,或者如果情感混合, 导致分数为 0。scoremagnitudescoremagnitudescoremagnitudescoremagnitude0magnitudescore
另请参阅以下专利。
情绪检测作为可审核实体的排名信号
谷歌的这项专利的最新版本是在2017年10月签署的。该专利部分描述了通过谷歌的 NLP API 进行情绪分析的过程。
该专利描述了如何使用情感分析来识别文档中可评估实体周围的情感。然后可以使用结果对实体和相关文档进行排名。可评估实体包括可以表达意见的人、地点或事物,例如:例如餐馆、酒店、电子产品等消费品、电影、书籍和现场表演。
结构化、非结构化数据和文本可以作为情绪分析的来源。结构化评论是通过知名评论网站收集的,例如 Google Maps、TripAdvisor、Citysearch 或 Yelp。结构化评论也可以从其他类型的文本文档(例如书籍、报纸和杂志的文本)中收集。
非结构化评论是引用可验证实体的文本文档,可能包含有关可验证实体的意见。非结构化评论包含文本评论,但没有星级等评级。非结构化评论通常包含新闻组或博客等结构化格式较差的文档中的情绪。
存储和排名过程通过排名分析引擎和实体排名数据存储库执行。实体排名数据存储库由情绪、实体评级和用户交互的数据库组成。用户交互数据库使用与实体相关的文档记录用户在 SERP 中的行为。该过程包括典型的 NLP 子步骤,例如词性标注。
情绪数据库中存储的实体以实体 ID、实体类型和一个或多个评论的形式的元组表示。评论会被赋予不同的分数,这些分数是由排名分析引擎计算出来的。
排名分析引擎计算相应评级的情感分数,包括作者等附加信息。
用户互动分数
共识情绪得分
为了确定用户交互分数,需要考虑诸如SERP – CTR和停留时长等用户信号。
用户交互分数 406是使用用户交互指标(例如用户点击率和在与搜 viber 数据库 索结果中呈现的排名实体415 相关联的网页上花费的时间)生成的 。排名分析引擎 130 监视用户与结果的交互以生成存储在用户交互数据库 148中的用户交互指标。
除了用户互动分数外,排名还包括其他分数,例如共识情绪分数。
410。可以通过对 与可审查实体 315相关联的情绪 分数312 取平均值 、选择与可审查实体315相关联的情绪分数312的中值情绪分数 312 、 或 选择 与 可审查实体315最频繁相关联的 情绪分数 312 来生成共识情绪 分数410。
值得注意的是,该系统根据领域相关内容或文档学习特定领域的分类器,用于特定领域的情绪分析。这里的域描述了最高层次的类别,例如人。阅读更多内容,请参阅文章《您需要了解的有关实体类型、类别和属性的一切》。
在一个实施例中,领域特定语料库 818 包含足够的文档来构成该领域中情绪表达方式的代表性样本。同样,领域独立语料库 820 包含足够的文档来构成情感表达方式的代表性样本,不包括任何特定领域。