世纪期刊的情感分析工具链

A widely recognized collection for machine learning tasks.
Post Reply
Bappy11
Posts: 353
Joined: Sun Dec 22, 2024 6:02 am

世纪期刊的情感分析工具链

Post by Bappy11 »

作者:Leonard Konle、Fotis Jannidis、Steffen Martus

抽象的:
本文讨论了使用期刊 DVjs 的距离测量来检测文学研究中的破坏性阶段。在此背景下,通过注释数据进行方法验证的不可能性被提出,并提出了一种通过模拟进行评估的替代方法。此外,我们通过主题建模分析了 DVjs 的内部结构,并得出距离测量和模拟的后果。

数字人文中的量子计算:创新还是夸张?基于量子的机器学习实验
长文

作者:Johanna Barzen 和 Frank Leymann

抽象的:
随着量子计算机的广泛应用,人们不禁想问:为什么不利用这项新技术的潜力来解决数字人文领域中现有的或全新的问题呢?特别是在基于量子的机器学习领域,当今的量子计算机已经可以实现部分优于传统解决方案的结果。例如,这对于数据量稳步增长且伴随分析需求的数字人文领域至关重要。为了探索量子计算的这种潜力,我们想介绍 QHAna,它可以比较传统和基于量子的机器学习方法的结果。

这些照片多么相似啊。从偶然发现到自动图像相似性搜索领域的系统研究
长文

作者:Wiebke Helm、Sebastian Schmideler、Chanjong Im、Thomas Mandl、Stefanie Kollmann、Lars Müller

抽象的:
我们都知道,思想和知识是通过文本传递的。但是,图像与伴随和解释它的文本相比,也有“自己的生命”。到目前为止,这一点几乎没有被注意到。本文以历史儿童和青少年文学为例来探讨这个问题,并特别关注教授知识的书籍类型。通过这种方式,我们将展示书籍插图的起源背景,并重建它们的参考资料。因此,可以更好地理解图像内容的教学选择,这被认为与 18 世纪和 19 世纪的儿童教育有关。解决问题的方法是跨学科的,结合了图书馆在数字化和提供图像源方面的视角、两种用于相似性搜索的异构信息科学方法以及儿童书籍研究的特定主题专业知识。我们将比较和批判性地反思这些方法的适用性和范围。

数字实验室中的实验。计算人文学科可以从科学史中学到什么关于其定义和术语的知识
长文

作者:Sarah Lang

抽象的:
实验的概念在数字人文学科中被广泛讨论,但仍然缺乏精确的术语。本文认为,计算人文学科子领域中的一组狭义场景可以实现接近科学的定义,超越了好玩的探索的隐喻。它建议我们应该关注那些已经将实验方法融入其解释学武器库的人文学科,例如实验考古学和实验科学史。它们都强调区分“体验”和“实验”,我认为这也应该适用于数字人文学科的实验概念。

代码实验

作者:Philipp Koncar、Bernhard C. Geiger、Christina Glatz、Elisabeth Hobisch、Sanja Sarić、Martina Scholger、Yvonne Völkl、Denis Helic

抽象的:
情感分析是自然语言处理 (NLP) 中的一项常见任务,旨在自动和计算识别文本数据中表达的情绪、态度和观点。虽然情感分析通常针对 Web 数据环境量身定制并广泛使用,但由于缺乏专门针对英语以外语言和更早语言的方法,将其应用于文学文本仍然具有挑战性。通过我们在这里介绍的工作,我们不仅为 18 世纪的法语、意大利语和西班牙语期刊引入了新的情感词典,而且还基 菲律宾电报数据 于 Jupyter Notebooks 构建了一个免费且公开的工具链,使研究人员能够将我们的词典创建过程和情感分析方法应用于他们自己的材料和项目。建议的工具链包括两个不同的部分:(i) 可选的情感词典创建和 (ii) 实际的情感分析。

»嵌入,嵌入!有人在敲门。« 使用嵌入和向量检测互文性
代码实验

作者:Bernhard Liebl 和 Manuel Burghardt

抽象的:
文本语料库中的互文引用检测是近年来备受关注的数字人文主题。虽然从文学研究的角度来看,互文性描述的是一段文本出现在另一段文本中的现象,但手头的计算问题是文本相似性检测任务,更具体地说是语义相似性检测任务。在此笔记本中,我们引入了 Vectorian 作为通过词嵌入(例如 fastText 和 GloVe)构建查询的框架。我们通过对齐(例如 Waterman-Smith-Beyer 和 Word Mover's Distance 的两个变体)评估计算文档相似性的影响。我们还研究了最先进的句子嵌入(例如 Siamese BERT 网络)在此任务中的性能——既作为文档嵌入,也作为上下文标记嵌入。总体而言,我们发现 Waterman-Smith-Beyer 与 fastText 提供了极具竞争力的性能。此笔记本还可用于上传新数据以执行自定义搜索查询。
Post Reply