信息分析 - 长安大学图书馆

advertisement
信息分析:图书馆服务深化
的一个重要方向
沙勇忠 兰州大学图书馆
LOGO
提纲
 对题目的阐释
 信息分析的内涵
 信息分析的领域
 信息分析方法
 信息分析案例
对题目的阐释
图书情报服务是一种专业服务
按照贝勒斯(M.D.Bayles)的观点,一种确定的职业(
profession)或专业具有如下特点:(1)职业人员必须
接受相当时间的教育训练,一般要完成大学教育;(2)
职业训练的内容以系统化的知识为主,而非师徒相传的技
能或技艺;(3)职业训练以服务为导向,旨在帮助解决
一般公众个人所难以解决的事务;(4)采用专业认证制
度;(5)成立专门学会或专业团体;(6)专业人员享有
工作的自主性。
医生、律师、教师、工程师、图书馆员等都被认为是这种
意义上的职业。可以看出,专业化和社会化是职业的两大
特征。
对题目的阐释
信息分析是最能体现图情专业内涵的服务形式
 《国家科学技术情报发展政策》蓝皮书指出:“情报研究
是对情报的深度加工,属思想库范畴。”
 在网络与数字图书馆环境下,图书馆员增加或空前强化了
以下两项重要职责:一是信息导航;二是信息咨询。如兰
开斯特(F. W. Lancaster)所指出的,“图书馆员的真
正专长在于他们能够担当信息咨询者或信息顾问的角色。
”这种咨询服务强调专业化分工和对馆内咨询资源的集成
,重视通过咨询课题的类型分工和采用先进的信息分析技
术与工具,来提高咨询服务的分析性和智力内涵,解决用
户所面临的问题。
对题目的阐释
图书馆服务范式的转移
对题目的阐释
图书馆服务范式的转移
对题目的阐释
图书馆服务范式的转移
对题目的阐释
对题目的阐释
 信息分析领域的多元竞争要求图情机构有所作为
1)咨询服务公司。如RAND、AC尼尔森、罗兰贝格等
2)情报分析中心。如美国国防技术情报中心(DTIC)和国防
情报分析中心(IACS),德国简氏情报集团(Jane’s
Information Group)、ISI、CIA、中国科学院等
3)企业、政府中的信息中心、市场研究部、政策研究中心
4)其他,如图书馆、ICP、数据中心、数据库服务商等。
例如,中国大陆市场舆论与调查机构有1000余家,2005
年的总营业额为120多亿元人民币,并以每年近3位数的
速度增长,而世界调查业的市场近年来以6%-9%的比例
增长。中国调查业营业额相当于日本的5.7%,美国的
1.5%。
对题目的阐释
数字知识环境与知识服务
对题目的阐释
数字知识环境与知识服务
对题目的阐释
数字知识环境与知识服务
对题目的阐释
新的图书馆职位设置
对题目的阐释
美国国会图书馆针对下列用户提供
区别服务:
 研究人员(Researchers)
 法律研究工作者(Law
Researchers)
 图书馆员和档案馆员(
Librarians & Archivists)
 教师(Teachers)
 儿童和家庭(Kids & Families
)
 出版社(Publishers)
 残疾人(Persons with
Disabilities)
 盲人(Blind Persons)
 新用户(Newcomers)
提纲
 对题目的阐释
 信息分析的内涵
 信息分析的领域
 信息分析方法
 信息分析案例
信息分析的内涵
信息分析(Information Analysis)就是围绕特
定的需求,提供有用的信息和智慧。
信息分析的抽象工作目标:
 从混沌的信息中萃取出有用的信息;
 从表层信息中发现相关的隐蔽信息;
 从过去和现在的信息中推演出未来的信息;
 从部分信息中推知总体的信息;
 运用相关信息对事物的状态和效果进行评价
信息分析的内涵
信息分析的性质
 两类知识:显性知识(explicit knowledge)和隐
性知识(tacit knowledge)
 两类思维:发散性思维和收敛性思维。
两类思维的区别及其运用的本领导致了普通专家和
出色专家之间的差异。
 两类方法:定性方法和定量方法
 必要的张力:在两类知识、两类思维、两类方法之
间保持必要的平衡。
信息分析的内涵
隐性知识与显性知识特点比较
隐性知识
(通过生活经验得到)
◇未被系统化的
◇个人的
◇经验性的
◇没有阐明的
◇涉及完形心理过程的
◇引导性的,可用以说明在一种科学
或一门艺术中的熟练技巧的
◇对人理解事物来讲是基本的,而又
主要是靠世代相传积累的
◇作为一切知识的不可缺少的部分的
◇能解决柏拉图提出的佯谬的
显形知识
(通过学习得到)
◇被清楚地表达出来的
◇公共的
◇客观的
◇可用言词、图表、公式、符号表达
◇逻辑性的
◇具有清晰文化背景的事实
◇如果背离了不言而喻的那些知识,
就会成为谬误来源的
提纲
 对题目的阐释
 信息分析的内涵
 信息分析的领域
 信息分析方法
 信息分析案例
信息分析的领域
科技信息分析
 科技发展战略信息分析
 科学前沿和发展态势分析
 科技竞争力评价
 课题或项目的背景调研和相关文献分析
 学科、专业、课题的专用数据库建设
科技发展态势监测分析的内容
监测对象
监测内容
监测目的
数据源
科技发展战略
与计划监测
国际、国内科技发展战略与计划的内
容、目标、实施举措、未来趋势
等
提供科技战略与计划所需的信
息支持,实现科技战略
的科学管理
科研规划、计划、传统的科技
文献资源、网络科技信
息资源、专家知识
科技发展环境
与需求监测
科技发展一般环境与具体环境,科技的
需求分析
提供科技发现环境与需求的信
息和知识
结构化的文献、专利数据库,
网页非结构化资源
特定技术领域
监测
国内外特定技术研发的现状及其发展
趋势,如研发现状对比、研究机
构、人员、装备等
提供国内外特定技术研发的现
状及其发展趋势,为技
术预测、技术评估、竞
争情报提供支持
文献数据库、专利数据库、网
络信息资源、专家知识
技术项目监测
技术创新项目研发的需求和技术状态
信息
为技术研发项目提供充分的市
场信息和需求信息,减
少项目风险
网络科技信息资源、专家知识
科技文献监测
特定科技文献作者、研究机构、研究
主题、发表时间、所在国家等信
息监测分析
提供特定技术研发现状, 研
发主题、研发机构和人
员、研究时间等关联关
系分析
文献数据库, 如SCI、EI、
INSPEC、CiteSeer、ISTP
、Elsevier、CSA、WP I、
DA I、IEEE、期刊网等
技术专利监测
特定技术专利的申请者、研究机构、
研究主题、申请时间、所在国家
等信息
特定专利研发现状,研发主题
、研发机构和人员、研
究时间等的关联关系分
析
各国专利数据库, 如PCT、
IN2PADOC、IPDL、D I、
QPAT - US 、Delphion等
研发主体监测
研发主体从事研究的资源和任务,包
括研究机构、人员、研究设备与
装备、研究项目、计划等
为科技管理提供研发主体的信
息支持
文献数据库、专利数据库、项
目计划、网络信息资源
信息分析的领域
全球科技跟踪网站
信息分析的领域
White和Griffith1981年所作的情报科学“认识地图”
White和McCain 1998年所作的情报科学“认识地图
”(1988-1995年段)
政府绩效管理研究的知识图谱
沙勇忠等《政府绩效管理研究的知识图谱与热点主题》,《公共管理学报》,
2010(3)
神经经济学的知识图谱
纳米技术领域:主要国家(地区)的研究状况和关系
Singapore
Silicon
Elemental semiconductors
Silicon
sputter etching
Elemental semiconductors
Netherlands
sputter etching
South Korea
nanostructured materials
electron beam lithography
Atomic force microscopy
nanostructured materials
nanostructured materials
Scanning tunnelling microscopy Germany Atomic force microscopy
electron beam lithography
Silicon
China
France
nanostructured materials
USA
Scanning tunnelling microscopy
Atomic force microscopy
Silicon
Russia
UK
electron beam lithography Taiwan
Japan
Elemental semiconductors
Atomic force microscopy
nanostructured materials
Scanning tunnelling microscopy
nanostructured materials
nanostructured materials
III-V semiconductors
Italy
electron beam lithography
Gallium arsenidenanostructured
materials
Atomic force microscopy
Atomic force microscopy
Atomic force microscopy
Sweden
nanostructured materials
Silicon
Scanning tunnelling microscopy
Switzerland
“数据挖掘”领域主题增长速度及研究力量分
布
5
Ar.p.p,
增长率
5
WEB挖掘
4 .5
4
3 .5
数据视觉化
3
可视化数据库
模糊集
2 .5
关联规则
交易数据处理
1
数据库中知识
大规模数据库
发现/数据采掘
遗传算法
查询操作
模式分类
2
2
1. 5
1
3
4
0 .5
数据仓库
Pc.p.p,
工业界参与程度
0
0
10
受学术界推动
Pc.p.p,
Ar.p.p
2 0
3 0
4 0
受学术界和工业界推动
- 在某个领域,工业界的论文占该领域总数的百分率。
- 在一定时期,某个领域的文章的平均增长率。
5 0
6 0
受工业界推动
7 0
兰州大学科研成果的相对影响力,与985和C9高校对比
可以看到:兰州大学科研成果的相对影响力已经于2004年超过了985高校的平均水
平,逐步接近C9高校的平均水平,但是与全球平均水平还有一定的差距。
兰州大学的优势学科
截至2010年11月,兰州
大学已经有7个学科进入全
球前1%的排名(按总被引
次数排名)
兰州大学网站的内部结构
Webtracer网络地图分析软件
http://www.nullpointer.co.uk//webtracer2.htm
中国38所”985”大学网站之间的连通情况
信息分析的领域
经济信息分析
 经济活动中的动态分析
 经济预测和预警分析
 企业竞争分析
 为制定经济规划和经济政策而展开的经济模型
分析、经济对策分析
 面向社会公众的各种经济咨询分析
信息分析的领域
中国宏观经济景气分析系统
数理统计方式法是定量研究的主要分析工具
细分市场
策略审计

交叉分析
描述细分
市场轮廓
聚类分析
样本结构
随机样本
 保证样本具有选定市场的代表性
有效样本
 总样本量至少在N=300,每个细分
市场不得少于N=50
 常见的问卷内容
品牌/产
品/广告
认知
 品牌形
象
 产品
使用
和态
度
 关键购
买因素
的重要
性/满意
度
 价格与
其他优
惠的得
失结合
 生活态度
 媒体习惯
信息分析的领域
10种竞争分析情报软件及评分表
软件名称
规划与
定向
信 息
收集
信息加
工
情 报
分析
产 品
传播
权重
5
10
10
15
10
7.5
1
5
2
9
C-4-U Sciut(C-4-U Ltd.)
5
Competitive
Intelligence
(CI)Spider
Versionl.2.1(Knowledge Computing Corp.)
Knowledge.Works
Version5.3(Ci-pher
Systemw)
Market Signal Analyzer(Docere Intelligence
5
2
9
6
Corporate Intelligence Service Version
1.0(Intelliseek,Inc.)
TextAnalyst 2.0(Megaputer Intelligence,Inc.)
9.5
2
3
3
Plumtree
Corporate
Portal
Version
3.0(Plumtree Software,Inc.)
Powerize Ccom Web Site (Powerize.com)
9.5
6
Strategy!Version2.5(Strategy Software,Inc.)
7
WisdomBuiler 2.3.0(WirdomBuilderLLC)
5
1
5
5
3
7.5
4
9
信息分析的领域
社会信息分析
 社会发展态势分析
 国情省情分析
 突发性危机事件预警分析
 公共政策的效果分析
 社会科学学术信息分析
信息分析的领域
信息分析的领域
2009年第四季度地方应对网络舆情能力排行
榜
具体得分及排名情况(人民网舆情监测室)
2009年第四季度地方应对网络舆情能力排行
榜
热点舆情事件舆情热度表(人民网舆情监测室)
提纲
 对题目的阐释
 信息分析的内涵
 信息分析的领域
 信息分析方法
 信息分析案例
信息分析方法
信息分析的方法来源
 逻辑学方法
 系统分析方法
 图书情报学方法
 社会学方法
 数学统计学方法
 经济管理学方法
与方法来源相辅相成的是,支持信息分析方法实现的技术
工具及其发展,我们称其为计算机辅助信息分析(
Computer Aided Information Analysis,CAIA)。
信息分析方法
信息分析方法体系
网络信息计量学方法体系
理论研究方法
……
WIF测度方法
日志分析方法
软件工具
软件工具
Web挖掘法
域名分析方法
网络内容分析法
链接分析法
网络地图分析法
图表法
软件工具
信息可视化方法
……
搜
索
引
擎
收
集
法
日
志
文
件
收
集
法
专
业
爬
行
器
收
集
法
网
上
调
查
法
结果展现方法
网络信息计量学研究方法的三维框架
网
下
调
查
法
……
图论分析法
模型分析法
数
据
收
集
方
法
信息分析方法
信息研究
数据库
信息分析
方法
有序化
组织
方法和软
件选择
文档及分
析研究性
资料
筛选和
鉴别
事实性数
据及其汇
总(DB/DW)
辅助分析
软件及工
具
SPSS DM OLAP …
CAIA工作流程
信息
分析
结果表
达和解
释
提纲
 对题目的阐释
 信息分析的内涵
 信息分析的领域
 信息分析方法
 信息分析案例
信息分析案例
技术预见:日本第8次技术预见项目
THOMSON
SCIENTIFIC
Science as a Group Activity
信息分析案例
技术预见(Technology Foresight)是以技术发展
为主体,整合社会经济发展,在现有信息的基础
上,通过系统化和科学化的理论和方法,探究未
来技术、经济、环境和社会发展远景、关键领域
和政策。
研究对象:有关科学技术、经济和社会的重大事
件、数据、信息及知识。
需求面
供给面
社会、经济、和政治的
长期发展趋势
社会、经
济与环境
方面特定
需求形成
科学和技术的长期发展趋势
科研需求
科学研究的资源和能力
技术开发需求
技术开发的资源和能力
市场潜力
创新机会与瓶颈
技术实现
研发和技术开发的可能性
社会、经济与文化
资源的优势和限制
整体评估社会
和经济效益
有发展潜力R&D领域
决定优先领域的次序
技术预见的系统分析架构
科技研发资源
和能力的优势
与限制
技术预测、技术评估与技术预见的比较分析
方法
技术预测
Technology
Forecast
任务
在较大领域内跟
踪观察并分
析新技术发
现的条件和
潜力
技术评估
Technology
Assessment
全面评估新技术
,支持决策
过程
技术预见
Technology
Foresight
确定具有战略性
的研究领域
,选择对经
济和社会利
益具有最大
贡献的关键
技术和通用
技术
应用领域
具体技术框
架;私
营部门
解决的问题
成果
技术发展的条件和
产生的成果;
发现技术突破领域
,以及具体技
术构架内的早
期预警功能
支持政治决策,促进实现知
识经济,发现技术突破
领域,具有早期预警功
能;
具体技术领
域或具
体问题
;各国
国会
分析评估具体技术
潜能或技术问
题
支持国家及
国家以
上层面
的决策
分析技术发展的影
响,确定发展
过程中的共同
问题;
确定具有战略性的
研究领域,同
时具有早期预
警功能
在全面的知识基础上做好制
定综合科技政策的预备
和工作;
获取更广领域内的信息,减
少决策前期工作的时间
;
避免由于未能充分考虑技术
发展的复杂性以及某项
政策的副作用,而可能
导致的错误
【案例】 日本第8次技术预见项目
项目委托 :
内阁办公室之科学技术政策委员会(CSTP )
 项目目标 :
 为下一次科学技术规划(2006~) 制订提供背
景
 为投资和资源配置提供政策建议
 新型技术预见过程
 一种新的综合方法的技术预见
第8次技术预见项目设计
客观的
推测的
文献计量分析
特尔菲调查
经济社会
需求分析
情景分析
主观的
规范的
科学
(基础研究)
技术
(应用)
社会
(影响)
特尔菲调查– 第一部分–
以往特尔菲调查的经验
 60 - 70% 的主题得到实现
 在一些方面同国外进行合作
 基于以往经验的新的做法
 领域-学科-主题的分层结构
 调查两个不同层次的实现时间
特尔菲调查的新做法
主题的选择 ,
主题的提问,
采用领域-学科-主题的分层结构
Field 1
I
II
III
IV
Area 2
A
B
C
D
Area 4
Area 1
Area 3
Topics
Area 5
在学科层面,
调查影响及其水平.
在主题层面,
调查实现时间、促进措施等
调查两个不同层次的实现时间
• 技术实现
• 社会实现
13个调查领域(13个小组)












信息与通讯环境
纳米技术与材料
制造业
工业基础设施
社会基础设施
面向社会的科学与技术
电子学
生命科学
健康、医疗与福利
农业、林业、渔业及食品
空间、海洋与地球科学
能源与资源
130个学科
860个主题
第一轮调查结果
G ap in tim e be tw e e n te c h n o lo gic al re alizatio n an d
so c ial re alizaito n
*N uclear fusion energy area excluded
15
A dvanced nuclear pow er
system
H ydrogen energy system
N ew paradigm in com puting &
Inform atics
G ap (Years)
10
M olecular & organic electronics
R esource
recycling
S torage
Fundam ental & basic
technologies for m anned
space activities
Integration system electronics
5
R obot electronics
Environm ental econom ic indicator
Environm ent-friendly distribution system
0
2005
2010
2015
2020
2025
T echnological realization tim e
Life science
ICT
Environment
Nanotechnology & Materials
Others
情景分析
– 第二部分 –
= 特尔菲调查的综合方法
特尔菲法的缺陷
• 一致同意
(= 观点的“平均数”)
• 仅是一种“看法”
Objective
Extrapolative
Bibliometric
Analysis
Delphi Survey Socio-economic
Needs Analysis
关键领域改进的脚本写作
• 强调个人专家
• 规范化的观点
• 每一领域的深度
Scenario Analysis
Subjective
Normative
Science
(Basic research)
Technology
(Application)
Society
(Impact)
改进的脚本
传统方法,
过去和现在分析
在新试验中,
改进的脚本,
过去和现在分析
制定战略与策略
战略与策略可能仅仅为过去和现
在的问题提供解决方案
脚本
制定战略与策略
• 战略可能是面向未来视角的解决方案.
• 重要行动项目可能是清新的.
Progressive
Scenario
Strategy
Analysis
Tactics 1
Tactics 2
Tactics 3
脚本写作
题目 (主题) : 约50个关键学科
 例如,科学技术进化模型、采用纳米技术的药物发现,
 具有5项感觉功能的通讯技术, 环境监测,
 大灾难后的信心恢复, 经济波动预测,等。

写作者 : 一个学科2名专家
 通过共同提名来选择

脚本写作规范(说明书)
 各学科使用统一的规范
 以时间为尺度标示出梗概或纲要
100个脚本由100位专家撰写
经济社会需求分析 –第三部分 –
经济社会趋势数据分析
 重要的问题

 保险与安全
 老龄化社会
 知识社会,等

Objective
Extrapolative
Bibliometric
Analysis
Delphi Survey Socio-economic
Needs Analysis
参与方法
 深度分析

问卷调查
Scenario Analysis
Subjective
Normative
Science
(Basic research)
Technology
(Application)
Society
(Impact)
工作流程
Trends data
Important Issue
Needs List
 Citizen
 Industry
Participatory process
Questionnaire survey
Structured
Weighted
Some views of future society and needs
around 2015
文献计量分析
– 第四部分 –
快速发展的研究领域 (RAs)
数据库分析
◇关键科学指标(ESI)中的研
究前沿数据库 (Thomson
Scientific)
◇由同被引关系所产生的论
文群
快速发展研究领域(RAs)之前沿
分析
◇项目组成员对快速发展领
域的深入分析
◇专家的评价
Objective
Extrapolative
Bibliometric
Analysis
Delphi Survey Socio-economic
Needs Analysis
Scenario Analysis
Subjective
Normative
Science
(Basic research)
Technology
(Application)
Society
(Impact)
同被引关系
核心论文
同被引
论文
A
引用论文 1
B
2
论文群具有相似的
研究主题
3
虚线表示一个引用
例如. Small H G. 科学文献中的同被引: 对两篇文献关系的一种新测度. 美国
情报学会会刊 24:265-9, 1973.
论文聚合
Highly cited
papers
Commercial database
1st step
Research Fronts
(RFs)
Research Front database in
Essential Science Indicators (ESI)
provided by Thomson Scientific
Our new approach
2nd step
Research Areas (RAs)
Aggregation of research fronts
through co-citation relation
研究前沿与研究领域的一个实例
大规模光谱测定硬件开发,
数据和信息处理的软件开发
( Proteomics )
1738
4203
104
397
4699
5462
1050
4682
10223928
3866
1674
3879
4151
2780
蛋白代谢分析
2751
2679(651cites)
3865
5780
2763
1173
4715
4676
运用2维电泳和蛋白质队列进行蛋白质
动态分析
4335
5764
4898
3032
5431
2721
2683
基因与蛋白质功能分析
选择的51个快速发展研究领域
RA name
RA name
Study on Acute Coronary Syndrome
Study on Cyclooxygenase-2 Inhibitor
Clinical Medicine
RA name
Peroxisome Proliferator-Activated
Receptor
①Glutamine Receptor ②Growth
Inhibition of Cancer
Basic and Application Study of Carbon
Nanotubes
Devices for Biotechnology
Chemistry
Application of Nano-Particles to
Biotechnology
Immune Disease Research
Molecular Devices/ Molecular Machines
Study on Hypertension
Neutrino Study
Molecular Mechanism of Apoptosis
Viral Hepatitis
Heavy-Ion Collisions
Proteomics
Brane Cosmology
Adipocyte Hormone
Sildenafil Citrate
High Temperature Super Conductors
Study on Regeneration from Stem Cells
Study on Biological Clock
Quantum Computer
Mesoporous Materials and Nanowires
Function Analysis on Plant Hormone;
Abscisic Acid
New Metallic Superconductors and
Heavy-Fermion Superconductor
Trace Elements Analysis of
Environmental and Biological Materials
Hormone Therapy
Physics
Plant & Animal
Science
Molecular Plant Biology
Function Analysis on Plant Hormone;
Auxin
Molecular Biology
& Genetics
Psychiatry/
Psychology
DNA Methylation
Alzheimer's Disease
Enzyme/Complex Catalyst
Engineering
Materials Science
Environment/
Ecology
Space Science
Inorganic/Organic Hybrid Material
Chemistry
Ionic Liquids
Carbon-Carbon Bond Formation
Reaction
Social Sciences,
General
Interdiscipnary/
Multidiscipnaly
Gene Expression Analysis based on DNA
Microarray
Influenza
Biomaterials (Biomedical Materials)
Genome Analysis of Microbe
Global-Scale of Oceanic Climate Change
Research
Isoprenoid Biosynthesis in Malaria
Protozoa
Paleoclimate research
Schizophrenia
Origin and Mechanism of the Universe
Effect of Air Pollution Particles for
Human Health
IT-based Organizational
Management/Knowledge Management
Decision Making and Governance based
on Behaviorism
Community development and Network
under Globalization
Cell Membrane Channels
RNAi (RNA interference)
Telomerase Study
对各部分的系统分析
经济社会需求
分析
文献计量分析
社会的
利益相关者
科学技术的使命
个人的
规范的
深度的
数据库
正在出现的学
科领域
情景分析
特尔菲调查
面向规划制定的科学技术
综合图景
Long
总结
第8次技术预见项目的2个特点 :
 “运用综合方法的国家技术预见”
 与科学技术政策制定过程相联系
改进的技术预见过程的四个组成部分正处于探索
和研究过程中,集成分析将得到应用。
 本项目的中期成果定期向内阁办公室之科学技术
政策委员会(CSTP) 及 MEXT 报告,以接受反馈
信息对项目的细节进行调整。
第八次技术预见调查结果(特尔裴调查)
技术实现时间
社会应用时间
858项课题的技术实现时间与社会应用时间分布图
日本领先的技术领域
日本
美国
欧洲
亚洲
政府参与的必要性以及政府应该采取的有效手段
社
会
应
用
时
间
与
政
府
参
与
的
相
关
度
政府参与必
要性最高的
技术领域是
前沿领域和
环境领域,
最低的是产
业基础领域
和信息与通
信领域。
技术实现时间与政府参与的相关度
http://pcim.lzu.edu.cn
LOGO
www.themegallery.com
Download