商务智能术语汇编
 
  在基于计算机决策支持的可视化应用越来越广泛之际,如何以一个学术项目的方式进行学习和思考商务智能呢?
目前,许多公司正在建立基于分析的组织单元,以便商业运作更加灵活有效;同时越来越多的决策者使用更多的软件工具来支持其工作 。
同时,消费者和组织在交互的过程中产生了海量数据。这些数据存储经过净化,则可用来帮助开发和提升适当的产品服务,促进消费者消费 .优化组织内运作等。
因此,以全面的方式通晓商务智能,就成了管理咨询顾问应知应会的新课题。为了让更多的伙伴理解商务智能,本文将商务智能术语汇总如下:
 

商务智能体系专用概念术语
 
active data warehousing (动态数据仓库)  参看Real-time Data Warehousing    (ROW )。
ad hoc query  (特定查询) 在查询发出时刻没有察觉的查询。
adaptive resonance theory  (自适应共振理论) 由 Stephen grossberg 创造的一个非监督的学习方法。自适应共振理论是一种神经网络架构,类似像大脑一样的无人监督状态。
algorithm (算法) 通过循序渐进的搜索来一步步提高,直到发现最好的解决方案。
analytical models (分析模型) 加载数据用来分析的数学模型
analytical techniques (分析技术) 使用数学公式直接派生出优化方法或预测某个结果,主 要用来解决结构化问题。
Application   Service   Provider  (ASP ,应用服务提供商)为组织提供租赁软件的软件零售商。
Apriori algorithm ( Apriori 算法) 通过使用递归的方法来识别频繁项集,发现关联规则的最通用算法。
area under the ROC curve  ( ROC 曲线下面积)
ROC 曲线下面积是一种在真阳性率为 Y 轴、 假阳性率为 X 轴上绘制的二元分类模型图形 评价技术。
artificial intelligence  (人工智能) 计算机科学的分支,主要关注符号推理和解决问题
Artificial Neural Network   (ANN ,人工神经网络)
尝试让计算机像人脑一样工作的计算机技术。机器拥有暂时记忆存储,处理模棱两可的信息。有时也简单称为神经网络 参看neural computing 。
association  (关联) 一类数据挖掘算法,建立与给定记录一起发生的项目之间的关系。
authoritative pages  (权威网页) 由于被其他网页和指令链接被认为特别流行的网页。
automated decision support(自动决策支持) 对重复管理问题提供解决方法的一种基于规 则的系统,也称为企业决策管理。
 
Automated  Decision System   ( ADS ,自动决策系统) 使用智能来对重复决策问题推荐解决 方法的一种基于商业规则的系统。
axon (轴突) 一个生物神经元的突出连接(也就是终端)
backpropagation  (反向传播)  神经计算中最知名的学习算法,通过对计算输出结果与期望 的训练集输出结果进行比较来完成学习。
Balanced Scorecard   ( BSC ,平衡记分卡} 一种绩效评价和管理方法,用来帮助将组织的 财务,顾客,内部流程,学习与成长目标和 任务转换成一套可行的措施。
best practices (最佳实践) 组织中解决问题的最好方法。这些通常储存在知识管理系统中 的知识库中。
BI governance (商务智能治理) 优化商务智能的流程。
bootstrapping (拔靴法) 一种从原始数据中不断抽取固定数目的实例作为(替代)样本用 于训练,数据集中剩余的数据用于测试的抽样方法。
brainstorming  (头脑凤暴}  人们产生想法的过程,通常有软件支持,(例如对问题形成可替代方案),也称为产生构思。
business analyst (业务分析员) 从事商业流程分析,并且得到信息技术支持的这类工作 的人。
business analytics (业务分析) 对商业数据直接进行模型应用。业务分析包括使用决策分
析工具,特别是模型,用来辅助决策者。最基本的是联机分析技术和决策支持系统,参看 Business  Intelligence   ( BI )。
Business Intelligence  (BI ,商务智能)  决策支持的一个概念框架。它将架构、数据库(或数据仓库)、分析工具及应用程序结合起来。
Business Performance Management  ( BPM ,业务绩效管理) 一种先进的绩效评价和分析 方法,包含计划和战略。参看 Corporate Performance  Management
categorical data (分类数据) 代表多个类的标签,用于转换为特定的群体变量。
clickstream data (点击流量数据)  网络环境中产生的数据分析。
cloud computing  (云计算) 作为网络资源用以提供服务的信息技术架构(硬件、软件、应用、平台),通常作为虚拟资源。
clustering (聚类) 将数据库分割成段,每段成员具有相似的性质。
Collaborative  Decision  Making  ( CDM ,协同决策) 将商务智能和社交软件集成的一种新的决策方式。
complexity  (复杂度) 根据优化模式.所需要的优化努力,或者随机属性,测试问题多么困难的一种度量方法。
confidence (置信度) 在关联规则里.发现规则的 RHS 出现在规则 LHS 的交易列表中的条件概率。
connection weight (连接权重) 神经网络模型中每个连接环节的权重基于神经网络算法 来评价连接的权重值。
Corporate Performance Management ( CPM ,企业绩效管理) 一种先进的绩效评价和分析 方法,包含计划和战略。参看 Business Performance Management 。
corporate portcal (公司门户网站) 进人公司网站的入口。公司门户网站可以通信、协调、接入公司信息。
corpus (语料库) 在语言学中,用于实施标识发现目的的大量结构化的文本(通常以电子 形式存储和处理)。
CRISP-DM   (跨行业数据挖掘过程标准) 一个实施数据挖掘的跨行业标准流程。按顺序一共六步,开始于对商务很好的理解及对数据挖掘的需求(也就是应用域),结束于满足特殊商务需求的解决方案部署。
Critical Success Factors  ( CSF ,关键成功因素)描述组织必须在它的市场空间中必须胜出的关键因素。
cube (立方体) 允许用户有组织地将一个立方体中任何属性的高度相互关联的数据子集(如商店、产品、顾客、供应商)与另一个立方体中的皮革(如销售、利润、单位、年龄)相结合来制造各种二维的视角,这些可以显示在顾客的计算机屏幕上。
Customer  Experience  Management   ( GEM ,客户经验管理) 通过检测网络应用事件及问题,跟踪和解决商务流程和应用障碍,报告现场性能和可用性,实现实时警报和控制, 对被观察参观者行为深度处理的诊断,从而得出整体用户经验的报告。
dashboard (仪表盘)  让执行人员查看关键数据的可视化表示,可以让执行者                          看到每分钟的热点来探索情况。
data (数据) 自身没有意义的原始事实(例如 名字、数字)。
data cube (数据立方体)  二维、三维,或者更高维对象,里面每个维度的数据代表一个利益的度量。
data integration (数据集成) 集成由三个主要过程组成:数据接入,数据联合,改变捕获。当这三个过程正确实施时,数据能够被访问,并且访问数据提取、转换和加载的数组,分析工具,以及数据仓库环境。
data integrity (数据完整性) 数据质量的一部分,在任何操作中(如转移、存储、检索) 都保持数据总体的真实性。
data mart (数据集市) 数据仓库的一个部门的数据,只存储相关数据。
data mining (数据挖掘) 使用统计、数学、人工智能、机器学习技术从大型数据库中抽取、识别有用信息和后续知识。
data quality (数据质量)  数据的历史质量,包括真实性、精确性、完整性和相关性。
data visualization (数据可视化) 数据以及数据分析结果的图形化、动画或视频演示。
data warehouse (数据仓库} 相关数据按照标准形式特殊地组织起来,能够提供企业范围 级别的干净数据的一个物理库。
Data Warehouse  Administrator  ( DWA ,数据仓库管理员) 负责数据仓库管理的人。
database (数据库) 被认为是简单存储概念的文件集,这样数据可以被更广泛的用户使用。
Database Management  System  ( DBMS ,数据库管理系统) 建立、升级、查询(例如管 理)数据库的软件。
deception detection  {欺诈行为侦查) 以声音、文本以及人体语言形式识别欺诈行为(故意传播不正确的信仰)的方法。
decision making (决策判定) 在可替换中选择的行为。
Decision Support  System   ( DSS ,决策支持系统) 支持管理决策流程的概念性框架,通常通过建模问题和定量模型来分析解决方案。
decision tree (决策树) 在{固定风险下,相互关联的决策序列的图形表示。这一技术将特殊实体按照实体属性分为特殊类;根的后面是内部节点,每个节点(包括根)有一个问题 标签,与每个节点相关的弧包括所有可能的反应。
dendrite {树突)  生物神经元部分,给细胞提供输入。
dependent data mart (非独立数据集市) 数据仓库直接生成的子集。
diagnosis control system (诊断控制系统) 一种控制论系统,它具有输入,将输入转化为输出的处理,与输出结果对比的一个标准或对照标准,一个反馈渠道,允许信息在输出和 标准之间变化,实现通信和采取行动。
dimension table (维度表) 表示数据如何被分析的表。
dimensional modeling (维度建模) 支持高容量查询访问的检索系统。
discovery- driven data mining  (发现驱动型数据挖掘)  一种数据挖掘的形式,用来发现数据的类型、关联和关系,目的是发现组织以前不知道,或者没有考虑的事实。
distance measure (距离测度) 在大多数聚类分析中,用来计算项目之间亲密程度的方法。
流行的距离测量方法包括欧几米德距离(用一个规则测试两点之间的通常距离)和曼哈顿距离(也称为两点之间直线距离,或出租车距离)。
DMAIC 一个闭环业务改进模型,包括以下几步:定义、测量、分析、改进和控制一个流程。
drill down (钻取) 信息的详细调查(例如,不仅发现整个销售量,还要发现按地区、产 品、销售人员划分来销售量),发现详细的来源。
 
Enterprise  Application  Integration   ( EAI ,企业应用集成) 提供将数据从源系统推入数据仓库工具的一种技术。
Enterprise Data Warehouse   ( EDW ,企业数据仓库) 为了分析目标开发的企业级数据 仓库。
enterprise decision  management  (企业决策管理)   请看Automated Decision Support Enterprise   Information   Integration ,企业信息集成) 实现将来自关系数据库、网络服务、多维数据库等各种来源的实时数据集成的进化工具。
entropy (熵) 在数据集测量不确定性或随机性程度的一个度量标准。如果数据集中的所有数据只属于一类,那么这个数据集中就没有不确定性和随机性,因此熵就为零。
expert(专家) 在特殊或很窄的领域内做出熟练判断的人。
extraction (提取) 从多个来源中捕获数据,合成数据,提炼数据,决定哪些是相关的然后以有效的集成方式将它们组织起来的流程。
Extraction,   Transformation,   and   Load   ( ETL, 提取、转换和加载) 由提取、转换和加载构成的数据仓库流程。提取就是从数据库读取数据。转换就是将提取的数据从以前的形式转换为需要的形式,这样就可以放入数据仓库或者另一个简单的数据库。加载就是将数据放入数据仓库。
functional integraton (功能集成) 通过一个单一的、一致界面的简单系统提供不同的支持功能。
fuzzy logic (模糊逻辑)一种逻辑上一致的推理方式。能够处理不确定性或者部分信息。模糊逻辑具有人类思考和专家系统的特性。
genetic algorithm  (遗传算法) 以渐进方式学习的软件程序,与生物逻辑系统进化相近。 Geographical   Information  System     ( GIS ,地理信息系统) 能够集成、编辑、分析、分享、 显示地理相关信息的信息系统。
Gini index (基尼系数) 经济上用来度量人口多样性的度量标准。相同的概念可以用于作为一个分支,按特定属性/变量决定的结果确定一个特定的类的纯度。
 
Global  Positioning  System   ( GPS ,全球定位系统) 使用卫星让用户能够相对精确地检测到连接设备上的(车或人)在地球上的位置的一种无线装置。
grain (粒度) 数据仓库中支持最高级别的详细定义。
Graphical User Interface  ( GUI ,图形用户界面)一个交互的、用户友好的界面,通过使用图标和类似的对象,用户能够控制和计算机的通信。
Heuristics (启发式) 应用领域里,判断规则组成的非正式和判断性的知识。启发式包含如何有效解决问题,如何制定解决复杂问题的计划步骤,如何提高性能的知识等。
hidden layer (隐含层} 具有三层或多层的人工神经网络的中间层。
hub {中转站) 一个或多个网页,提供链接到授权网页的集合。
Hyperlink- Induced Topic Search   ( HITS ,超链接主题搜索) Web 挖掘中众所周知使用最广泛的引用算法,用于发现链接权威度和内容权威度。
hypothesis-driver data mining (假设驱动型数据挖掘) 一种数据挖掘的类型,从用户的几个命题开始,然后寻找命题的真实性。
independent data mart  (独立数据集市) 为一个战略商务单位或部门设立的小数据仓库。
information overload (信息过载)提供的数据太多,对个体来说处理和吸收任务很困难。
information  (信息) 数据按照有意义的形式组织。
information gain (信息粒度) ID算法中使用的分离机制。
intelligence (智能) 通常面向解决任务和问题的一定程度的推理和学习行为。
intelligent agent (智能代理) 一种嵌入计算机信息系统,使其更加聪明的基于知识或专家系统的系统。
interactivity  (交互性) 软件代理的属性,允许不依赖于人的介入能够相互交互(通信和协同)。
interval data (区间数据) 在区间范围内可测量的变量。
inverse document frequency  (逆文档频率法)
一种在术语文档矩阵中通用而且非常有用的目录转换,表明了词的特殊性(文档频率) 以及它们整体发生的频率(术语频率)。
Key  Performance   Indicator   ( KPI,关键绩效指标) 面向战略和目标的绩效考核。
k-fold cross-validation ( k 折交叉确认) 一种流行的用于预测模型的真实度评价技术。将完 整的数据集大体按相同尺寸随机分成 k 份, 分类模型要重复 k 次来训练和测试数据。每 次选取 1个作为测试数据,其余的作为训练数据。交叉检验评价模型的整体真实性是将 每次实验的真实性测试进行平均的最后值。
knowledge (知识) 从教育或经验中理解、认知或精确获得的,任何可以学习、察觉、发现、推论、理解的;对信息使用的能力。在知识管理系统中,知识是采取行动的信息。
knowledge base (知识库) 事实、规则、具有模式的程序的集合。知识库是有关特殊兴趣
领域的所有信息和知识的集合体。
Knowledge Discovery in Databases ( KDD 数据库,知识发现) 执行规则归纳或相关程序, 从大型数据库中建立知识的机器学习过程。
knowledge management (知识管理) 组织中专业知识的动态管理。包括收集、分类和传播
知识。
Kohonen’s self-organizing feature  map  ( Kohonen  的自组织特征映射)  一种典型的机器学习神经网络模型。
Lean Manufacturing (精益生产) 消除流程中浪费或没有增值特性的生产方法。
learning (学习) 通过利用已经知道的来获得新知识的自我提高过程。
learning algorithm (学习算法) 用于人工神经网络的训练过程。
link analysis {链接分析) 许多有趣对象之间的链接被自动发现,例如学术刊物的作者群体之间的网页链接和引用关系。
machine learning (机器学习) 计算机从经验中学习的过程(例如,利用程序从历史案例中学习)。
management science (管理科学) 应用科学方法和数学模型分析和解决管理决策情况(例 如问题,机会),也称为运营研究。
metadata (元数据) 关于数据的数据。在数据仓库中,元数据描述数据仓库及其使用方式
的内容。
Microsoft enterprise consortium (微软企业财富团体) 从全世界范围接入 Microsoft SQL Server2008 软件套装,用于学术目的教学与研究。
dleware (中间件) 连接不同计算机语言和平台应用模块的软件。
mobile social networking (移动社交网络) 成员之间使用手机或其他移动设备交谈和联系。
multidimensional analysis (多维分析) 包含多个纬度数据分析的建模方法。
multidimensional database  (多维数据库)数据特殊地组织起来支持简单和快速多维分析的数据库。
Multidimensional OLAP  ( MOLAP ,多维联机分析处理) 通过特殊的多维数据库(或数据 存储)实施联机分析处理,提前将交易总结为多维视图。
multidimensionality   (多维性)  从多个维度组织、呈现、分析数据,例如按地区、按产品、按销售员、按时间划分的销售额(四个维度)。
Multi-Layered Perceptron ( MLP ,多层感知) 人工神经网络分层结构中多个隐含层可放置在输入层和输出层。
Natural  Language  Processing   ( NLP ,自然语言处理) 使用自然语言处理器与计算机系统接口。
neural computing (神经计算) 一种实验计算机设计,目的是以一种人脑功能建模操作方式建立智能计算机。
neural network  {神经网络)  请看 Artificial  Neural Network 。
neuron (神经元) 生物逻辑或人工神经网络的一个细胞(也就是处理元素)。
nominal data (名称数据) →种包含为对象标签简单代码测量的数据类型,它是不用测量 的。例如,婚姻状况变量能够通常分为: ( 1)单身;(2 )己婚;(3 )离婚。
numeric data (数值数据) 代表特殊变量数值的一类数据。大量的数字数值变量包括:年龄、孩子生日、家庭整体收入(以美元计算)、旅行距离(英里)、温度(华氏度)。
Online Analytical  Processing   ( OLAP ,在线分析处理) 一种信息系统,能够让用户查询系统,实施分析等,结果会在几分钟内产生。
Online Transaction  Processing   ( OLTP ,在线交易处理) 主要用于捕获和存储日常商务功能数据的交易系统。
operat mart (操作集市) 一种可操作数据集市。 一个操作集市是组织中单一部门或功能区域使用的小规模数据集市。
Operational Data Store  ( ODS ,业务数据存储) 一种数据库类型,通常用于数据仓库的一个过渡区,特别是客户信息文件。
optimization (优化) 辨别出可能是最好的问题解决方案的流程。
ordinal data (序数数据) 包含代表等级顺序, 作为标签分配给对象和事件的代码。例如, 信用分数变量可以整体分为几类: (1)低; (2 )中;(3 )高。
parallel processing (并行处理)  一种先进的计算机处理技术,允许计算机立刻并行地完成多种处理。
Part of-speech tagging  (词性标注) 基于字在使用中的的定义,上下文,对文本中的词(如名词、动词、形容词、副词等)标记成为演讲中特殊的部分。
pattern recognition (模式识别) 一种将外部类型与计算机存储记忆中的类型匹配的技术
(也就是说,将数据按已经决定的类别进行分类)。类型识别用于推理机、图形处理、神经计算和语音识别。
performance measurement systems  (绩效考核系统) 将业务指标与定期反馈报告结合起 来显示围绕目标进步的系统方法。
physical integration (物理集成) 将多个系统无缝集成为→个功能系统。
polysemes (多义词) 也称为同音异义词。它们是语法相同(也就是拼写一样),但是意思 不同的词,例如 bow 可以翻译为“前倾”, 或者是“船的前面”、“射箭的武器”、“一种系丝带”。
prediction  (预测)  讲述未来的行为。
predictive analysis  {预测分析) 利用工具帮助决定事件或状况发生的可能的未来输出。 predictive analytics (预测分析学) 一种用于预测的商业分析方法(例如需求、问题、机会),而不是用于简单的报告数据。
privacy (隐私) 通常是指独处权和免受不合理的个人侵入。信息隐私是决定一个人的信息在什么时候,可以以什么程度传递给其他人的权利。
problem solving (问题解决) 一个人从最初的状态开始着手一个过程,通过问题空间的搜索,以确定一个预期的目标。
Processing Element  ( PE,处理单元) 神经网络中的一个神经元。
prototyping (原型) 在系统开发中,在很短的时间内构建按比例缩小的系统或者系统的一 部分,经过多次迭代后进行改进的一种策略。
Rapid Miner 一种流行的、开源的、免费的数据挖掘软件套件,采用了图形用户增强界面, 具有大量的算法和一系列数据可视化特点。
ratio data (比率数据) 解释连续的数据差异和比率。比率规模的显著特点是拥有非任意零比率。
Real-time  Data Warehousing ( RDW ,实时数据仓库) 加载数据,并通过数据仓库提供数据,使其可用的过程。
reality mining (现实挖掘) 基于本地数据的数据挖掘。
regression (回归) 一种用于真实世界预测问题的数据挖掘模型。它的预测值(也就是说,
输出变量或者因变量)是数字(如,预测明天的天气是 68 华氏度)。
relational database (关系数据库) 数据库的记录有组织地形成表,这些表可以被关系代数或者关系演算进行处理。
Relational OLAP  ( ROLAP ) 关系型联机分析处理。
result ( outcome) variable (结果变量) 表达决策结果的变量(例如,关心的利润),通常是一个决策问题的目标。
RFID (无线射频识别技术) 利用射频波来识别物体的一种通用技术。
risk  (风险)  概率或随机决定的情况。
robot (机器人) 具有特定的,没有人的现场干预可以完成人类所具有的手动功能能力的机器。
SAS Enterprise Miner  由 SAS 研究所开发的一款全面的商业数据挖掘软件。
scenario    {场景)   关于一个特定系统在特定的时间运作环境的假设和配置的声明。
scorecard (记分卡) 一个可视化显示,通过图表显示战略、战术和任务目标。
search engine (搜索引擎) 发现并列出符合一些用户选择标准的网址或网页(通过统一资 源、定位符 URLS 设计)。
SEMMA     SAS 研究所提出的数据挖掘项目的替代过程,是抽样、探索、修正、建模和分析 的缩写。
sensitivity analysis  (敏感分析) 一个或多个输入变量对提出的解决方案影响的研究。
sentiment analysis (语义分析) 使用大量的文本数据源对特定商品或服务喜欢还是不喜欢观点进行探测的一种技术。
sequence discovery  (序列发现)  随着时间推移进行关联辨别。
sequence mining (序列挖掘) 一种发现方法模式,事物之间的关系是根据它们出现的顺序 来考察的,以此来辨别时间推移关联。
sigmoid function  ( S 型函数) 从 0 到 1 的 S 型转换功能。
simple split (简单拆分) 数据被分割为两个相互排斥的子集,称为训练集和测试集。比如通常可将 213 的数据设计为训练集, 113 的数据设计为测试集。
Singular  Value   Decomposition     ( SVD ,奇异值分解) 与主成分的分析密切相关,它将输入矩阵(输入文档的数量和抽取术语的数量)的整体维度减少到低维,每个连续维度代表最大程度的(文字与文档的)可变性。
Six sigma (六西格玛) 一种绩效管理方法,目的是在业务流程中每百万缺陷机会减少到零。
snowflake schema (雪花架构) 雪花架构是多维数据库中表的逻辑关系,其实体关系图表现为雪花状。
Social Network Analysis  ( SNA ,社交网络分析) 人、团体、计算机、其他信息和知识处理实体之间的关系和信息流的映射和测量。网络节点是人和团体,连接显示了节点之间的关系和流动。社交网络分析提供了关系的可视化和数学分析。
software agent  (软件代理) 持续提供(由所有人)已设计好任务的一款自主软件的服务。
Software as a Service   ( Saas ,软件即服务} 软件的使用方式是出租而不是卖出。
speech  ( voice)   recognition  (语音识别} 人工智能研究的一个领域,尝试允许计算机识别人类的语言字句。
SPSS PASW Modeler  由SPSS  (以前的 Clementine)开发的一款非常流行的商业化的,全 面的数据、文本、 Web 挖掘软件套件。
star schema (星形架构} 最常用的和最简单的三维造型风格。
stemming (词根} 为了在文本挖掘项目中更好地表现它们,减少单词直到它们的根形式。
stop words {无用词} 被过滤掉的自然语言数据处理之前或之后的话。
story (故事) 具有丰富信息和情节的案例。教训通常是从那些案例库中的案例中提炼出 来的。
strategic goal (战略目标} 在指定时间内客观量化的目标。
strategic objective  (战略目的) 描述组织目标方向的一个广泛的声明或行动。
strategic theme  (战略主题) 与战略目标相关的一些集合体,用来建立战略地图的结构。
strategic vision  (战略愿景} 关于组织在未来看起来会是怎样的图画或心理意象。
strategy map (战略地图) 从四个平衡记分卡的四个视角体现组织的关键目标之间关系的一个可视化显示。
Structured  Query   Lanaguage    ( SOL ,结构化查询语言}关系型数据库的数据定义和管理语言。 SQL 前端是关系型数据库管理系统。
stummation function {求和函数} 添加到一个特定的神经元的输入机制。
supervised learning (监督学习) 一种人工神经网络的训练方法,样本案例作为网络的输 入,为了减少输出的错误,权重被调整到最小。
support (支持) 测试产品或服务多久一起出现在相同的交易中,也就是说,数据集中在特殊规则下,包含所有产品和服务交易的百分比。
Support Vector Machine  ( SVM ,支持向量机}  广义线性模型,从而实现输入功能的线性组合价值为基础的分类或回归的决定。
synapse  (突触) 在神经网络处理单元之间的连接(权重)。
system architecture  {系统架构} 系统的逻辑和物理设计。
Term- Document Matrix  ( TDM ,文献术语矩阵} 创建数字化和组织化的文献(语料库)的频率矩阵,其中,列代表术语,行代表各个文档。
text ming (文本挖掘) 数据挖掘在非结构化和很少结构化文本文件中的应用。它可以从非结构化文本中产生有意义的数字指标,然后用各种数据挖掘算法处理哪些指标。
tokenizing (标记处理) 根据它表现的功能对一块文本(表征)分类。
transformation (transfer) functions {转换函数)  在一个神经网络中,总结和转换在一个神经元出发之前的输入,显示了内部激活水平和神经元输出之间的关系。
trend analysis  (趋势分析} 收集信息,并尝试发现信息的类型和趋势。
unsupervised learning {无监督学习} 这是自组织训练人工神经网络的一种方法,只有输入剌激能够在网络中显示。
user interface (用户界面} 一个计算机系统的组成部分,允许系统和用户之间进行双向沟通。
utility (on-demand) computing ( (面向需求的) 效用计算) 无限的计算能力和存储容量, 就如电力、水和电话服务,账单基于每次使用的基础上付费,可按需获得,使用并按任 何应用重新分配。
visual   ( Internet)   community    (虚拟{因特网}社团) 具有相似兴趣的一组人,通过使用因特网进行相互交互。
visual team (虚拟团队) 一个团队的成员在不同的地方一起开会。
visual worlds (虚拟世界) 由计算机系统创造的人工世界,在这里用户具有沉浸在其中的 感觉。
Voice of Customer  ( VOC ,用户的声音) 通过网站访问者的直接反馈,对其他网站和线下渠道的标杆收集和报告,支持未来访客行为的预测模型这些行为,将问题集中于“谁和如何做”的应用。
Web2.0  高级因特网技术的流行术语,包括博客、维基百科、 RSS、社会书签等。Web 2.0 和传统万维网的一个最重要的区别是因特网 用户和其他用户、内容提供商、企业之间更大的合作。
Web analytics  (Web 分析) 商务分析活动在基于 Web 流程,包括电子商务上的应用。
Web content mining  ( Web  内容挖掘) 从网页上提炼有用的信息。
Web crawler  (网络爬虫) 自动读取网站内容的一种应用。
Web mining (Web 挖掘) 通过基于web 的工具从网页上发现和分析关于网页的有趣并且有
用的信息。
Web service ( Web 服务) 使软件服务和联系它们的分布式应用程序组装在一起的一个架构。
Web structure mining ( Web 结构挖掘) 从包括网络文档等链接上开发有用信息。
Web usage mining  ( Web 使用挖掘) 提炼通过登录网页、交易等方式产生的有用信息。
Weka 一种流行的、免费的、开源的机器学习软件套件,它是在怀卡托大学用 JAVA 编写而开发的。
Wiki (维基百科) 一个服务器软件,允许用户使用任何网络浏览器在网站上自由共创和编 辑网页内容。
企业管理咨询业的领导者-北大纵横管理咨询公司亚太最具影响力的咨询公司
发布者:蔡伦 | 标签:信息化 | 评论:0 | 阅读:303 | 发表于:2016/8/31 0:39:36