目录:
- 对大数据的敏感度
- 目前,Clarabridge正在为其客户提供一些复杂而有趣的功能,包括单击根本原因分析,以确定是什么原因导致文本提要量的变化,情绪或与新兴问题相关的满意度。它还提供了作为软件即服务(SaaS)的解决方案。
- 加拿大OpenText公司可能以其在企业信息管理解决方案方面的领先地位而闻名。它的愿景是围绕企业的非结构化数据进行管理,保护和提取价值。它提供了它所谓的“语义中间件”。 “
视频: 7.庫博中文語料庫文本分析工具-研究取徑與介紹 2024
以下是文本分析大数据市场的一些参与者的概述。有些是小而有些是家喻户晓的名字。有些人称他们做的是 大数据文本分析 , ,而有些则将其称为 文本分析。
对大数据的敏感度
Attensity是十多年前开始开发和销售产品的原始文本分析公司之一。目前,它拥有150多家企业客户和世界上最大的NLP开发集团之一。 Attensity为文本分析提供了几个引擎。这些包括自动分类,实体提取和彻底提取。 Exhaustive Extraction是Attensity的旗舰技术,可自动从解析后的文本中提取事实并组织这些信息。
<! - 1 - >该公司专注于社交和多渠道分析和参与,通过分析来自内部和外部来源的报告文本,然后将其路由到业务用户进行参与。它最近购买了一家社交媒体公司Biz360,该公司汇聚了大量的社交媒体。它开发了一个网格计算系统,为处理海量的实时文本提供了高性能的功能。
<! Attensity使用Hadoop框架来存储数据。它还有一个数据排队系统,可以创建一个编排流程,识别入站数据的高峰,并根据需要调整更多/更少的服务器的处理。大数据的Clarabridge另一个纯粹的文本分析厂商Clarabridge实际上是一家商业智能(BI)咨询公司(称为Claraview)的分拆,它意识到需要处理非结构化数据。其目标是帮助企业通过整体观察客户,查明关键经验和问题,帮助企业中的每个人实时采取行动和协作,从而推动可衡量的商业价值。<!这包括实时确定客户反馈数据/文本的情绪和分类,并将其逐字逐句放入Clarabridge系统。
目前,Clarabridge正在为其客户提供一些复杂而有趣的功能,包括单击根本原因分析,以确定是什么原因导致文本提要量的变化,情绪或与新兴问题相关的满意度。它还提供了作为软件即服务(SaaS)的解决方案。
IBM针对大数据
软件巨头IBM在“智慧地球”(Smarter Planet)战略框架下,在文本分析领域提供了多种解决方案。除了Watson和IBM SPSS之外,IBM还提供IBM Content Analytics和Enterprise Search。 IBM Content Analytics是根据在IBM Research完成的工作开发的。 IBM Content Analytics用于将内容转换为分析的信息,可用于类似于在BI工具集中分析结构化数据的详细分析。 IBM Content Analytics和Enterprise Search曾经是两个独立的产品。融合解决方案针对使用文本分析的增强型企业搜索以及独立内容分析需求。 ICAES与IBM InfoSphere BigInsights平台紧密集成,实现了非常大的搜索和内容分析集合。
用于大数据的OpenText
加拿大OpenText公司可能以其在企业信息管理解决方案方面的领先地位而闻名。它的愿景是围绕企业的非结构化数据进行管理,保护和提取价值。它提供了它所谓的“语义中间件”。 “
据该公司介绍,其语义技术演变的根本在于其能够”在跨语言,格式和行业领域的大型数据集上高精度地实现实时分析“。 “语义中间件背后的思想是语义可以在不同层次上暴露出来,并且可以使用不同的技术来解决业务问题。也就是说,文本分析可以在需要时启用和使用。大数据SAS
SAS长期以来一直在解决复杂的大数据问题。几年前,它购买了文本分析供应商Teragram,以加强其在分析中使用结构化和非结构化数据的策略,并将这些数据集成到描述性和预测性建模中。现在,其文本分析功能是其整个分析平台的一部分,文本数据被视为另一个数据源。 SAS继续在高性能分析领域进行创新,以确保性能满足客户期望。我们的目标是花费数周时间来解决和解决这些问题,或者过去需要花费几天才能在几分钟内解决问题的问题。例如,SAS高性能分析服务器是一个内存中的解决方案,它允许您使用完整数据开发分析模型,而不仅仅是聚合数据的一个子集。 SAS表示,您可以使用数千个变量和数百万个文件作为分析的一部分。该解决方案运行在EMC Greenplum或Teradata设备以及使用Hadoop分布式文件系统(HDFS)的商品硬件上。