关于我们 | 联系我们 | 定制服务 | 订购流程 | 网站地图 设为首页 | 加入收藏

热门搜索:汽车 行业研究 市场研究 市场发展 食品 塑料 电力 工业控制 空调 乳制品 橡胶

当前位置: 主页 > 产业观察 > IT通讯 >  2013年中国非结构化信息概述

2013年中国非结构化信息概述

Tag:信息  

中国产业研究报告网讯:

    在信息处理领域,按照信息的类型和处理方法不同,信息处理分为结构化信息处理和非结构化信息处理。结构化信息,又称结构化数据,如财务报表、统计报表、股票行情等,它们都有一定的结构,通常以表格的形式表达。结构化信息处理主要基于对数值进行计算,如比较大小、排序、求和等数学或逻辑运算,并根据计算结果控制计算机系统运行。 

    内容选自产业研究报告网发布的《2013-2018年中国信息技术产业发展前景预测与投资风险分析报告

    非结构化信息,就是相对于结构化信息而言,比如公司公告、新闻、调研分析报告、图片等等,它们通常以文档、网页、电子邮件、图像,甚至如视频和音频等多媒体类型存在。这类信息很难用统一的数据模型描述其结构和关联关系或者与特定应用相关的复杂类型的数据,不方便或无法用关系数据库系统进行存储和处理的数据。非结构化信息处理不是基于数学和逻辑运算,而主要是基于“理解”信息内容,包括各种形式的分类、检索、信息抽取、内容匹配等多种方法,将“理解”的结果提供给使用者或控制计算机系统运行。 

    结构化和非结构化信息管理在企业信息化应用中的定位

    结构化和非结构化信息管理在企业信息化应用中的定位

    非结构化信息规模暴增,是非结构化信息处理技术和软硬件产品市场需求快速增长的主要原因 

    IDC与EMC公司2010年5月5日发布题为《数字宇宙十年——你是否准备好?》的研究结果,这是第四次测算数字宇宙的突破性数据增长速度,估量和预测全球每年创建和复制的海量数字信息,以及它对个人和IT专业人士的影响。 

    报告表明在2009年经济大萧条时期,数字信息量比2008年增长了62%,达到8000亿GB(0.8ZB)。而2010年产生的数字信息量将达到1.2ZB。每年创建的数字信息量从2009年到2020年将增长44倍,声音、电视、广播、打印等所有主要的媒体形式都将完成从模拟到数字的转变,全球数字信息总量将达到35ZB。如果用DVD记录,一张张叠加起来的长度可以往返地球与月球之间。 超过70%的数字宇宙由个人产生。但80%的数字宇宙需要由企业存储、保护和管理。由于社交网络和Web 2.0技术不断渗透到企业,企业责任将有增无减。2007年IDC关于数字宇宙的报告预测,到2010年,中国的数字信息量预计为900.5亿多GB,是2006年的7倍,超过全球的增长速度(6倍)。实际上在上述2010年IDC的报告中称过去几年对于数据增长的预测严重低估了数据的生成量,显然,数据增长的速度在加快,2010年到2020年这十年时间中将创建更多的数据,意味着普通企业将面临数据迅猛增长带来的信息管理方面的挑战。 

    按照Gartner的预测,文本、格式文档、表格、电子邮件、图像和音视频等非结构化信息占机构中信息总量的80%以上,正成为增长最快的信息类型。政府部门是信息资源的最大拥有者,掌握的信息甚至达到全社会信息总量的80%。政府部门拥有大量不同格式、不同载体的政务信息资源,包括政策、法规、计划、公文、档案、报告、统计数据等,这些信息资源缺乏统一规划,共享程度低,利用率不高,影响了政府提高决策执政效率和推进政务公开,影响了电子政务为企业和社会公众服务目标的实现。除政府以外,越来越多的企业也认识到信息正在影响和驱动着整个企业中许多至关重要的业务过程。这些重要信息包括产品技术规格、营销材料、网页、客户服务数据、供应商合同、电子邮件、图片资料等,其规模正在成倍地增长,隐含着企业在金钱和时间上的巨大投资,是企业重要的信息资产,对其有效管理并挖掘信息价值,能够给企业带来超值回报。当前,应用非结构化信息处理技术正成为政府机构和企事业单位信息管理的重要趋势。