政府資料開放發展趨勢與發展建議 余孝先 工業技術研究院 資訊與通訊研究所 Nov. 5, 2012 Copyright ITRI 工業技術研究院 報告大綱 工研院簡介 Open Data 定義與效益 全球Open Data發展現況 Open Data的商業模式 – 收費 – 授權原則 – Ecosystem 如何推動Open Data Copyright ITRI 工業技術研究院 2 工業技術研究院 ⊙ 工研院台北辦事處 工研院光復院區⊙ 工研院中興院區 ⊙ • 1973年依「工業技術研究院設置條 例」 所設立之國家級財團法人研發機構 • 院區:台北辦事處、新竹中興/光復 院區、南分院六甲院區/南創園區、 工研院六甲院區⊙ ⊙ 工研院南創園區 及中、高、東部技術服務中心 Copyright ITRI 工業技術研究院 3 工研院現況 總人力:5,721人 專利獲證數 博 士:1,323 碩 士:3,105 學士等:1,293 院 友:22,135 Copyright ITRI 工業技術研究院 17,659件 新創公司 產業服務(2011) 技轉衍生:72家 服務家次:15,197家 育成服務:173家 次 技術授權:639案件 (2012年09月01日) 4 工研院任務 以科技研發,帶動產業發展, 創造經濟價值,增進社會福祉 Copyright ITRI 工業技術研究院 5 工研院組織架構 工研院 產業學院 產業學院 企畫與研發處 行銷傳播處 國際中心 技轉中心 產業服務中心 創意中心 產業經濟與趨勢研究中心 奈米科技研發中心 影像顯示科技中心 量測技術發展中心 服務系統科技中心 雲端運算行動應用科技中心 南分院 南分院 行政服務處 會計處 資訊中心 人力資源處 電子與光電 資訊與通訊 研究所 生醫與醫材 研究所 研究所 綠能與環境 機械與系統 研究所 研究所 材料與化工 研究所 知識經濟與競爭力研究中心 (2012年01月02日) Copyright ITRI 工業技術研究院 6 Copyright ITRI 工業技術研究院 7 「公開資料加值」不是Open Data好的翻譯, 「開放資料」較好 重點不是公開,而是開放! 加值不是唯一目的! Copyright ITRI 工業技術研究院 8 名詞定義(1/2) 公部門資訊 (Public Sector Information; PSI), 政府資料(Government Data): – 公部門因為本身在運作上的需要,會持續生產 大量的資料。這些資訊一般稱為「公部門資訊」 – 例如:氣象資料、地理空間資料、人口統計、 健康醫療資訊、社會經濟指標、工商登記資料、 科學研究資料庫等。 Copyright ITRI 工業技術研究院 9 名詞定義(2/2) 政府資訊公開 (Freedom of Information) vs. 開放政府 資料 (Open Government Data, Open Data) – 「政府資訊公開」是政府的透明化,讓人民有知的權利。 – 「開放政府資料」是要更進一步,除了知以外,人民要有 使用、增補、 結合其他資訊他用、 散佈等的權利。 Open Data (開放資料): – 一般指開放政府資料,主要指以電子形式儲存之資料 – Generally require that the data must be accessible (e.g. online), in standard and re-useable formats, and under licenses that allow for data to be re-used in different contexts. Copyright ITRI 工業技術研究院 10 Open data的特性 Open Data free to use for anyone 資料是自由可用 Accessible Available Data Easy to Use & Re-use Re-purpose, Re-distribution 資料易使用、再利用、再推廣 機器可判讀(Machine-readable ) 完整(complete)、原始(raw/disaggregate ) 公開檔案格式(open file format) Searchable Discoverable Data Easy to Find & Search 資料易蒐尋 Source: Open Data at World Bank, 2011 Copyright ITRI 工業技術研究院 11 Open Data 的多元效益 落實民主、透明政策 聚焦:預算透明、施政績效 Where does my money go? FBI 十大要犯 提升治理效能 聚焦:政策與法律之推動 例子:提供犯罪資料,協 助治安問題改善 Copyright ITRI 工業技術研究院 帶動經濟 & 創新 聚焦:藉由ICT創新應用、 帶動經濟發展 12 Open Data 之經濟效益 歐盟預估 現在:歐盟27國因公部門資訊(Public Sector Information)再利用所產生之市場 規模(包含直接或間接),2008年之調查統計約為279億歐元,且預估每年將以618%的成長率遞增 未來:若放寬歐盟相關法令限制(如適度解除目前對於資料取得、再利用之限制) ,同時強化相關Open data之配套科技架構研究計畫(如FP7、FP8 Horizon 2020 等),估計每年可再增加約200億歐元之經濟價值(約佔1.7% GDP ) 麥肯錫預估 預估歐盟若善用PSI進行有效加值再利用後,每年可創造3,000億美元 Direct market associated with PSI use less important than spillovers and new uses. E.g., 時間節省效益 挪威:以時間成本來評估PSI的效益,人民可因良好的資訊流通而每年節省約2 小時(如因了解交通資訊節省通車時間) 歐盟:依人數比例及每人生產總值推算,歐盟27國總計每年可省下13.95億歐 元 資料來源: MICUS,2009, Castelein,et al.,2010, Coote and Smart,2010, Fornefeld,2011, Vickery,2011 Copyright ITRI 工業技術研究院 13 他山之石:全球 Open Data 發展現況 Copyright ITRI 工業技術研究院 14 Open Government Data http://opengovernmentdata.org/data/map/ Copyright ITRI 工業技術研究院 15 Open Government Data 風潮勢不可擋! 國家:美國、加拿大、英國、德國、義大利、澳洲、紐西蘭、丹麥、芬蘭…30國 州(美國):加州、奧勒岡、華盛頓、亞利桑那、德州、紐約州… 市(美國):紐約市、波士頓、芝加哥、舊金山、西雅圖、亞特蘭大、巴爾迪摩… 市(歐洲):倫敦、伯明罕、巴黎、里昂、巴塞隆納、赫爾辛基… 市(加拿大):溫哥華、渥太華、多倫多、Edmonton、 Nanaimo、Calgary Update: 2012/4/30 資料來源: http://www.data.gov/opendatasites Copyright ITRI 工業技術研究院 16 推動Open data 已成先進國家重要政策 多數推動國家均已設立入口網站,且依照部門、類別提供相關datasets供 免費下載使用,其中以英、美兩國之dataset數量最為完整、豐富,且均 將Semantic web & Linked data應用列為重點發展項目 2011年 美國 •總開放之dataset數量>40萬 •Data.gov網站點閱數>2億次 •Gov Apps:1146 •Apps by citizen:236 •Mobile Apps:85 2011年 英國 •總開放之dataset數量>7700 Copyright ITRI 工業技術研究院 17 Open Data in the U.S. U.S. Open Government Initiative – Creating policy framework Data.gov – Making high value government data accessible Challenge.gov – Harnessing the power of government data to create new solutions U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 18 U.S. Open Government Initiative “My administration is committed to creating an unprecedented level of openness in Government…Openness will strengthen our democracy and promote defficiency and effectiveness in Government. “ -- President Obama, January 21, 2009 U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 19 U.S. Open Government Initiative – Policy Framework Federal agencies directed to: • Publish government information online • Improve quality of government information l •Create a culture of open government • Develop and implement agency-specific open government plans U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 20 Open Government Dashboard http://www.whitehouse.gov/open/around U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 21 Accessing High Value Government Data • Flagship U.S. open government initiative • Instant, central access to over 400,000 government datasets in easy to use, open formats • Data from across the federal government • Enables development of innovative applications • Drives innovation and knowledge use across the globe U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 22 Data.gov Model Catalog of high-value, machine-readable datasets generated by U.S. federal government agencies 185 agencies and sub-agencies participating Includes “raw” datasets, data tools and apps, geospatial and interactive datasets Interactive datasets are API-enabled to empower developers to create apps using the data Rapid growth and uptake from May 2009 to today: • Datasets increased from 47 to 400,000 • Downloads went from zero to over 2 million U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 23 Creating Apps that Improve Lives: Asthmapolis Knowledge of where asthma attacks occurred historically reduced incidence of daily attacks by 62% in six months. U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 24 Challenges Spark Ideas, Data Drives Decisions • Data.gov communities identify national issues • Challenge.gov creates structure for problem-solving events • Unites developers and innovators with government to solve problems • Resulting apps transform data to help citizens make better decisions • Cost is lower than paying for traditional development U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 25 Creating New Solutions – Challenge.gov Crowd sourcing platform for challenges and prizes for solutions to government problems. Many use open data sets. Incentives – monetary or other prizes – are awarded to winners Cost-effective – pay only for successful entry/solutions Broad engagement – innovative ideas and expertise outside traditional sources Partner with private sector to fund or expand prizes U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 26 Apps for the Environment Challenge Environmental Protection Agency (EPA) challenged the public to use its data in new ways to address environmental issues 38 developer teams participated Five winning apps help Americans: • Switch to energy-efficient light bulbs • Compare air quality index, air pollutant levels, and energy consumption of U.S. cities • Get directions and carbon footprints for driving, transit, flight, walking and biking transportation options Prize was recognition event in Washington DC rather than payment U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 27 Future Direction – National Action Plan President Obama announced the Open Government Partnership and US National Action Plan at the UN General Assembly in September 2011 • 50 countries around the globe participating Contribute Data.gov as a platform • India and U.S. creating open source platform for use by any country or city Foster communities on Data.gov • Health, energy, and law plus education, research, and safety Launch International Space Apps Challenge • NASA and other space agencies will gather scientists and citizens • Use data for global challenges: weather impacts on global economy and depletion of ocean resources U.S. General Services Administration Office of Citizen Services and Innovative Technologies Copyright ITRI 工業技術研究院 28 Open Data 商業模式 Copyright ITRI 工業技術研究院 29 Charging? Free is the default! Taxpayer has already paid for most data Economic gain maximised when priced at marginal cost of distribution – Raw data free – Possible small service charge for reliable API Sales revenue not material to most agencies Sales administration typically >25% of revenue Exception: where data collected for sale “Public task" data free," value added" charged Andrew Stott. Experience, Business Models and Case Study of Open Data in UK, Jan 2012 Copyright ITRI 工業技術研究院 30 Clear, common, licensing approach “Open” licence essential for unrestricted re-use Clarity vital, especially for businesses Common licensing for all Government data valuable UK OGL – free to reuse – with attribution – without misrepresentation CC-BY a good alternative Copyright ITRI 工業技術研究院 31 Public Data Re-Use Value Chain Government Data Creation Business Aggregation and Organisation Consumer Processing, editing and packaging Marketing and delivery End Use Significant value Government should not do more than strictly necessary Copyright ITRI 工業技術研究院 32 Emerging Business Models Models already seen in UK: Cleansing and Organizing Data Information Services to the Public Data Mining Operational Efficiency/Optimization Financial Products Customer Attraction and Retention Data Broking Source: Andrew Stott, Experience, Business Models and Case Study of Open Data in UK (2012.01.18) Copyright ITRI 工業技術研究院 33 Business Model: Cleansing and organising data Ex. Spikes Cavell Spikes Cavell –Data used: ● Public sector spend, contract and pricing data –服務內容: ● Perform data transformation – Ex. Data Cleanse, Redact, Classify, … ● Provide analytical insight – Transform the way goods and services are procured – 降低公部門採購成本: » Ex. : Increasing competitive tension by introducing new suppliers in those categories where there are fewer suppliers than the average for the sector » Ex.: Indentifying other public bodies who buy from the same suppliers where the potential exists to harness the group's collective buying power –Spikes Cavell 獲利方式: 提供服務給公部 門 Reference: http://www.spikescavell.net/ Copyright ITRI 工業技術研究院 34 Business Model: Information Services to the Public Ex. My city Way My City Way: 提供城市綜合資訊 – Data used: ● 城市重要景點, 公廁, 公共交通, 餐 廳檢測, 公共場所安全檢測記錄,旅 館, 停車場,… ● citizen data: 電影評價, … – 已有全球40 個以上的城市加入 My City Way – 2010年 > 1M downloads – 獲利方式: ● 在地合作夥伴之營收抽成 (電影訂 票, 旅館訂房, …) Ref. My City Way Copyright ITRI 工業技術研究院 Business Model: Information Services to the Public Ex. Transport Apps Ex.城市地鐵擴增實境服務APP (Paris/London Transport Apps) – 獲利方式: ● 一次性收費 (sale of application) : 0.99 € ● 3 年收入: 300,000€ Ex. 波蘭城市交通服務班表 APP – 獲利方式: ● free download: 基本服務 ● Premium: 加值服務 – Features: geo-localization of public transport stops and advanced searches – yearly fee 2.5€ Ref.: 2011 OECD Copyright ITRI 工業技術研究院 Business Model: Data Mining Ex. iSoft clinical trials Ex. iSoft clinical trials – Data used ● patient data (匿名), diagnoses, treatments, medications and outcomes – Data source: from NHS (National Health Service, one of the publicly funded healthcare systems in UK ) – 計畫目的: ● Using the data for advanced analysis, prediction and improved drug discovery – 運作方式: ● Partnership: iSoft, Southampton University Hospital ● iSoft: – 提供 clinical data mining tool (AccelFind by CliniWorks ) – in return: performing analyses on behalf of biomedical companies ● Southampton University: – 提供data, run queries on its records, perform clinical trial (all the de-identification and extraction is done by the hospital ) – In return: use data mining tool free of charge – iSoft 獲利方式: 提供服務給 biomedical companies Reference: http://www.ehi.co.uk/, http://www.ehealthnews.eu Copyright ITRI 工業技術研究院 Business Model: Operational efficiency/optimisation Ex. Nielsen: Business uses for GIS + census data Nielsen公司: 提供consumers watch 服務 Data used: – Data released by the United States Census Bureau, GIS Applications – Ex. Promotion on the local and micro market : ● 分析 Demographics data 以 決定廣告看板最佳地點, 決 定 廣告播出時段, etc. Nielsen獲利方式: – 為客戶提供 marketing strategy 服務 Reference: http://www.nielsen.com Copyright ITRI 工業技術研究院 38 Business Model: Financial Products Ex. 保險公司淹水潛勢加值應用 Ex. 保險公司淹水潛勢加值應用 –Data used: GIS , 淹水潛勢資料 –利益關係者 Hawaii淹水潛勢圖 http://gis.hawaiinfip.org/fhat/ ● 美國聯邦政府: 提供並管理水災保險計畫NFIP (National Flood Insurance Program), ● 企業: 100 家以上的保險公司加入 NFIP ● 地方政府: 建築執照審查, 管理flood plan 內的住戶 清單 ● 房屋位於淹水風險區內的住戶 – 必須購買水災保險 – 必須遵守FEMA (Federal Emergency Management Agency )相關法令以降低水災損害 –機制設計: 淹水潛勢分析+房屋設計規格 水災 保險費用 ● 淹水潛勢 淹水風險區 (SFHA, Special Flood Hazard Area) 分為不同等級 ● NFIP 建立房屋防洪設計標準,鼓勵優良設計 ● 依淹水風險及屋況訂定保費 維吉尼亞州 Alexandria 市 推動水災保險計畫 Reference: http://alexandriava.gov/FloodMap Copyright ITRI 工業技術研究院 –保險公司獲利方式 ● 準確評估水災風險與可能受害程度, 以決定 水災保費, 降低保險公司損失的風險 Data Brokerage Ex. Windows Azure Marketplace Business Model – Data publisher: decide what data people can access, the terms of use associated with the data, and the price customers should pay to use the data ● Ex., The latest agricultural data released by the USDA in a complete and organized format ● Use: Examining trends in specific geographic areas and specific times – Data user : 付使用月費 – Microsoft Azure Marketplace ● 提供平台, 讓 data publisher 放置data, 媒合 data user and data publisher, 管理 user account (security, billing, etc.) ● There will be a percentage markup to cover the cost of bandwidth, compute, and billing expenses but this is not the primary driver of the business. ● The goal for Microsoft is the larger platform play – indirect monetization is the key Reference: https://datamarket.azure.com/browse/Data Copyright ITRI 工業技術研究院 40 如何推動 Open Data Copyright ITRI 工業技術研究院 41 臺灣 Open Data 發展現況 • 中央推手:行政院研考會 – 主政策:第四階段電子化政府 – 旗艦計畫:基礎資料庫倍增 – 推動目的:政府內部營運管理 – Open data網站:無 • 地方推手:臺北市政府 – 專責單位:資訊處 – 推動時程:100/08正式推出 – 推動目標: 提供政府公開資料更簡易的取得管道 提倡政府公開資料加值及應用 提高政府施政透明度及效能 – 開放dataset數量:134 – 舉辦App競賽:App Star高手爭霸戰 – 衍生App數量:>10 Copyright ITRI 工業技術研究院 原始目的為強化政 府內部運作管理, 而非從外部使用者 之觀點考量,因此 仍有相當空間進行 配套措施之調整, 以利Open data目 標之達成 資料來源:行政院研考會 & 臺北市政府 42 Open data 推動之關鍵議題 1. 資料開放 2. 資料易使用、再利用、再推廣 3. 資料易蒐尋 • 凝聚共識創造利於推動的環境 –篩選優先開放的資料 –廣邀利益相關者參與推動 –相關法規研擬 • 建立易於複製擴散的資訊平台 –打造理想的「data.gov」網站 –展開LOD基礎建設 –發展可複製之SOA樣板以利擴散 • 打開國際名聲醞育營運模式 –構築台灣開放資料鏈結網(LOD) –建立國外合作與管道與機制 –典範案例檢視「資料經濟」 Copyright ITRI 工業技術研究院 43 篩選優先開放的資料 資料來源: Open Data @ The City of Vancouver, 2010/5 優先開放資料類型之考量:Easy & Useful! 內部現成資料:開放成本低且資料之整理、處理不複雜 開放資料之價值高 (對民眾服務有價值、可提升治理效能…) 不具爭議資料 Copyright ITRI 工業技術研究院 44 廣邀利益相關者參與推動 加強內部溝通 政府 部門 廣宣擴散 •利用媒體介紹App應用 案例,廣宣資料開放效益 社群 媒體 市民/ 企業 建立雙向互動機制 •了解民眾/企業需要甚麼資料 •了解民眾需要甚麼服務 建立雙向互動機制 •推出使用指南 •舉辦App競賽 •舉辦workshop Open Data •挑選代表性App案例進行宣導, 暢通內部資料開放管道 •制定Open data License,降低 推動阻力 程式開 發者 學校 研究單 位 委託研究 •各式dataset開放之效益評估 •舉辦座談會,廣納建議 Copyright ITRI 工業技術研究院 45 相關法規研擬 • 背景:法令規定需與時俱進,符合公共資料開放的新思維 • 目的:訂定清楚可依循公共資料取得(Access)與再利用(Reuse)規範。 • 作法:借鏡國外案例,了解權責單位、配套法規與授權機制 1. 現有法規之盤點與檢討 1)資料開放 (Data Access/Freedom of Information Act) 2)資料再利用 (Data re-use/DIRECTIVE 2003/98/EC on the re-use) 3)資料授權 (Open Government License) 4)使用條款 (Term of use) 5)智財權 (Intellectual Property Act) 6)個資法 (Data Protection Act) 2.跨議題之一致性與協調 1)資訊再利用專法之研擬 Copyright ITRI 工業技術研究院 46 相關法規研擬 英國開放政府資訊的授權組合 類型 用途 開放政府授權 商業 (Open 非商業 Government License;OGL) 非商業用途之政 非商業 府授權(NonCommercial Government License) 收費性授權 (Charged License) 商業 非商業 免費 是 使用情況 大部分的公部門資訊可在免費的情況下取得 及再利用。 使用上須受皇室著作權 (Crown copyright) 限制。 是 可免費取得及再利用資料,但僅提供給非以 營利為目的之第三方團體(third parties)。 公部門不能釋放資料給第三方團體以營利為 目的而再使用。 資料提供者(Information Providers)需取 得 HMSO 的 授 權 才 得 使 用 有 皇 室 著 作 權 (Crown Copyright)的資料。 否 資訊提供者(Information Providers)必須 支付費用,該費用收取以回收資料產製成本, 及負擔合理的資料取得及再利用報酬為原則。 資料提供者需取得HMSO的授權才得使用有 皇室著作權 (Crown Copyright)的資料。 資料來源:OPEN GOVERNMENT LICENCE 2.0(2011) Copyright ITRI 工業技術研究院 47 Clear, common, licensing approach “Open” licence essential for unrestricted re-use Clarity vital, especially for businesses Common licensing for all Government data valuable UK OGL – free to reuse – with attribution – without misrepresentation CC-BY a good alternative Copyright ITRI 工業技術研究院 48 Open Data授權條款之原則 英國 / 挪威 / 義大利 授權對象 •全球性、非排他性、免版稅 使用範圍 •複製、發佈、部分使用、組合、商業應用 資料引用 •註明來源、鏈結原資料源、不以官方地位取信他 人、不得誤導或歪曲信息 •不保證信息沒有錯誤或遺漏、不承擔因使用資料 免除責任 而造成的任何責任、不保證持續提供資料 •個人資料、非法資料、組織標誌、未有授權許可 除外項目 之第三方資料、其他知識產權,包括:專利、商標、 設計權及證明文件 Source: Summary by ITRI, 2012 49 Copyright ITRI 工業技術研究院 Data Publishing – Star Quality Ease of reuse Put your data on the Web (any format) Make it available as structured data (e.g. Excel, CSV, instead of PDF) Use open, standard formats (e.g. XML, RDF) Use URLs to identify things (so people and machines can point at your data) Link your data to other people’s data Copyright ITRI 工業技術研究院 50 打造理想的「data.gov」網站 各個階段簡短而訂定有明確目標 Dataset: 每個資料集均由其擁有者控制 data.gov 網站保存 metadata 而非原始資料本身 資料整理:分類(by topic/category, agency)、搜尋功能、更新頻率、整包下載 結構化資料:Semantic web(5顆星) 工具: 提供API(例如 Open 311 API) 提供圖像化資訊:dashboard-style visualization 提供互動/意見回饋機制:FAQ, Q&A, facebook, twitter, e-mail, 討論區 提供新知:最新消息、經驗分享(最佳應用案例) Keep IT Simple 運用公開原始碼 (CKAN、Drupal等) 將資料存放於現有網站上或者公用雲端 Copyright ITRI 工業技術研究院 51 總結 Open Data: Turning government data into gold – 為國民、企業、政府帶來更多好處,例如:新興服務、創業機會、治理效率等 Lesson Learned from UK and US – Executive level support is essential - not just at start – Handling the concerns of data owners – Sunshine is the best policy - transparency improves data quality – Business Model: Free is the best pricing model – Link open government to agency mission - help agencies fulfill their purpose – Key is liberating data to achieve value - rather than focusing on the data itself – Overcome obstacles practically by doing, not debating! 開放資料推動重點:「開放、易使用、易蒐尋」 – 凝聚共識創造利於推動的環境 ● 篩選優先開放的資料、廣邀利害關係人參與推動、相關法規研擬 – 建立易於複製擴散的資訊平台 ● 打造理想的「data.gov」網站、展開LOD基礎建設、發展可複製之SOA樣板以利擴散 – 打開國際名聲醞育營運模式 ● 構築台灣開放資料鏈結網(LOD)、建立國外合作與管道與機制 Copyright ITRI 工業技術研究院 52