上海市交通碳排放预测分析研究 摘要 近年来,全球气候变暖问题日益显现,温室气体排放量的不断增加是导致 这一问题的主要原因。2020 年习近平主席郑重宣布,中国将坚决推动碳减排工 作,力争在 2030 年前二氧化碳排放量达到峰值。据国际能源署统计,我国交通 碳排放量约占全国碳排放总量的 10%,为三大碳排放来源之一。而上海作为我 国经济,金融,贸易和航运中心,其碳排放量持续增长,与其“2025 年前确保 碳达峰”的目标仍有较大差距。本文基于上海市交通运输业的历史碳排放数据 建立预测模型并进行分析,为上海市交通运输业减碳提供了思路与借鉴。 为研究上海市交通碳排放现状及未来发展,紧跟市政府“十四五”规划布 局,本文通过上海市统计年鉴、能源统计年鉴等收集 2001-2022 年数据资料, 并利用 IPCC“自上而下”碳排放计算法,核算上海市历年交通碳排放量,然后 通过相关系数法筛选变量,并将变量作为模型的输入,通过比较各模型 RMSE、 R2 ,选取最优模型,最后利用情景分析法,对上海市未来碳排放达峰趋势做预 测。 研究表明:第一,通过斯皮尔曼相关系数筛选相关程度大于 0.7 的变量,其 指标均与碳排放量具有正相关关系,通过控制变量增长可以直接或间接控制交 通碳排放。第二,通过模型比较,发现支持向量机模型普遍优于神经网络模 型,最优回归预测模型为 RBF 神经网络。第三,通过采用情景分析法,设定基 准情景和优化情景对上海市交通碳排放量进行预测分析。在基准条件下,上海 市交通碳排放量难以在 2025 年实现碳达峰;在优化情景下,上海市交通碳排放 量将在 2025 年实现碳达峰。因此,本文认为上海市交通碳达峰的实现仍具有一 定困难,政府应该继续加强政策宏观调控和指导,让交通碳减排助力全市碳达 峰目标。 关键词:交通碳排放量;碳达峰;机器学习;优化算法;情景分析 i 目录 摘要................................................................ i 表格与插图清单..................................................... iv 一、引言............................................................ 1 (一)研究背景 .................................................. 1 (二)研究意义和目的 ............................................ 2 二、文献综述........................................................ 3 (一)交通碳排放核算方法 ........................................ 3 1.“自上而下”法............................................. 3 2.“自下而上”法............................................. 3 3.全生命周期法............................................... 3 (二)碳排放预测方法 ............................................ 3 (三)交通碳排放研究区域 ........................................ 4 三、研究思路和创新点................................................ 5 (一)研究思路 .................................................. 5 (二)创新点 .................................................... 6 四、数据来源与处理.................................................. 6 (一)数据的来源 ................................................ 6 1.交通运输行业能源消耗数据................................... 6 2.社会、经济、交通指标数据................................... 6 3.能源碳排放相关计算参数..................................... 6 (二)变量的选取 ................................................ 7 (三)数据处理 .................................................. 8 1.变量预处理................................................. 8 2.数据归一化................................................. 8 (四)交通碳排放计算 ............................................ 8 1.碳排放核算边界............................................. 8 2.碳排放测算................................................. 9 ii 五、上海市交通碳排放模型构建....................................... 10 (一)建模预处理 ............................................... 10 1.相关性分析................................................ 10 2.数据集处理................................................ 11 (二)基于神经网络的交通碳排放模型 ............................. 11 1.BP 神经网络 ............................................... 11 2.基于遗传算法优化的 BP 神经网络............................. 13 3.RBF 神经网络 .............................................. 15 (三)基于支持向量机回归的交通碳排放模型 ....................... 16 1.普通支持向量机回归........................................ 16 2.基于粒子群优化的支持向量机回归............................ 18 (四)模型的评价 ............................................... 19 1.模型评价指标.............................................. 19 2.模型评价分析.............................................. 19 六、基于情景分析预测交通碳达峰时间................................. 20 (一)情景分析法介绍 ........................................... 20 (二)变量重要性分析 ........................................... 20 (三)交通碳排放的情景设定 ..................................... 21 1.基准情景下的碳排放........................................ 22 2.优化情景下的碳排放........................................ 22 七、结论与建议..................................................... 23 (一)总结 ..................................................... 23 (二)政策建议 ................................................. 24 (三)研究局限与展望 ........................................... 25 参考文献........................................................... 26 附录............................................................... 27 iii 表格与插图清单 表格 表 1 初始指标选取表 ............................................ 7 表 2 模型 RMSE、R2 对比表 ...................................... 19 插图 图 1 上海市碳排放时空变化图 .................................... 2 图 2 技术路线图 ................................................ 5 图 3 上海市交通碳排放图 ....................................... 10 图 4 相关系数图 ............................................... 11 图 5 BP 神经网络结构图......................................... 12 图 6 BP 神经网络预测对比图..................................... 13 图 7 GA-BP 神经网络预测对比图.................................. 14 图 8 GA-BP 神经网络训练效果图.................................. 14 图 9 RBF 神经网络结构图........................................ 15 图 10 RBF 神经网络预测结果对比图............................... 16 图 11 SVR 示意图............................................... 17 图 12 支持向量机预测对比图 .................................... 18 图 13 PSO-SVM 预测结果对比图................................... 19 图 14 变量重要性图 ............................................ 21 图 15 基准情景下交通碳排放预测图 .............................. 22 图 16 优化情景下交通碳排放预测图 .............................. 23 iv 一、引言 (一)研究背景 温室气体排放过多引发的全球气候变暖现象,将会导致海平面上升、地表 温度增高,冰川退缩等一系列威胁人类生存的自然问题,引发国际社会广泛的 关注。政府间气候变化专门委员会(简称 IPCC)在《第五次气候变化综合报 告》中指出,全球变暖的主要原因是能源消耗所产生的温室气体排放。二氧化 碳作为温室气体中最主要的组成部分,自从工业化以来,随着世界经济的发 展、大量化石能源的利用,二氧化碳排放量迅速增加。根据联合国报告,如果 不加以控制,全球二氧化碳排放量将在 2050 年增加一倍以上,甚至导致全球近 地表平均温度进一步升高,突破历史新纪录。 交通运输是国民经济中具有基础性、先导性、战略性的产业,是重要的服 务性行业和现代化经济体系的重要组成部分。但在其交通行业快速发展的同 时,也导致二氧化碳排放的增多。据世界银行在《城市交通与气候变化》中指 出:交通运输行业的碳排放是全球温室气体排放的重要来源之一,其二氧化碳 排放约占全球燃料燃烧所排二氧化碳的 23%。在 2021 年中国 100 多亿吨的二氧 化碳排放中,交通运输行业的碳排放量占总二氧化碳排放量的 10%左右。 上海市,地处长江入海口,是中国经济发展最活跃、开放程度最高、创新 能力最强的区域之一。作为我国的经济、航运、贸易中心,虽然促进了地区经 济发展,但其排放的二氧化碳也给环境造成了巨大的压力。上海市碳排放量自 2001 年开始逐渐增长,其碳排放时空分布如图 1 所示。上海市政府在《上海市 生态环境保护“十四五”规划》中提出,到 2025 年,上海市将确保碳排放总量 达峰,相较于全国提前五年实现碳达峰,生态环境质量稳定向好,大气环境质 量全面达标。但目前,上海市碳排放量增幅仍难以减小,抑制碳排放增长迫在 眉睫 。交通运输业是继工业、建筑后的第三大碳排放源,研究交通运输业的减 排对于上海市来说有着重要意义。 因此,本文基于上海市交通碳排放进行研究,首先应用 IPCC“自上而下”法 核算了上海市交通碳排放量,并通过相关系数,筛选与交通碳排放量相关系数大 于 0.7 的指标;构建机器学习模型如 BP 神经网络、支持向量机等,对上海市交 1 通碳排放量进行回归预测;将得到的最优回归模型与情景分析法相结合,预测上 海市交通运输业未来的碳达峰情景,为制定后续的碳减排策略,促进上海市碳达 峰目标做出了贡献。 图 1 上海市碳排放时空变化图 (二)研究意义和目的 了解国内外交通运输业碳排放等相关议题的既有研究,分析城市交通运输业 有关案例,有助于完善我国现阶段在此方面的理论研究,为加快建设低碳交通运 输业提供理论支持与科学依据。 对上海市交通运输业的碳排放影响因素进行研究,建立交通运输业碳排放预 测模型,找出目前上海发展所存在的问题,为实现上海交通运输行业高质量发展 提供思路。 利用情景分析法,预测在基准、优化情景下,交通运输行业碳排放将在何时 到达峰值,在保证城市快速发展的情况下,推动碳减排工作,为制定相关政策提 供积极思路。 2 二、文献综述 梳理城市交通碳排放相关研究文献,已有的文献主要有以下三类:第一类 文献主要定量测度交通碳排放量并分析城市交通碳排放驱动因素,实证探究各 因素对交通碳排放的影响;第二类文献通过构建仿真模型、LEAP 模型,预测各 种情境下的交通碳排放趋势;第三类文献主要通过对国际大都市交通碳减排案 例与对策建议的研究,提出低碳交通的可行方案。本文结合上述三类主要文献 的方法,以上海市为研究对象,利用机器学习研究其影响因素、碳排放趋势及 利用情景分析法二者相结合来提出对策建议,更加全面地研究城市交通碳排 放。 (一)交通碳排放核算方法 1.“自上而下”法 即通过地区范围内的交通运输行业能源消耗数据乘以燃料碳排放系数计算 交通碳排放量。其优点是数据易于获取、准确度高,可以通过统计年鉴来获取 地区能源消耗数据。但其不足在于,无法体现不同交通方式的碳排放情况,并 且将交通运输、仓储和邮政作为一个整体统计,难以进行拆分来单独统计交通 运输行业碳排放。 2.“自下而上”法 即依据不同交通方式的活动水平乘以单位活动水平的碳排放因子来计算交 通碳排放量。其优点在于能够精确反映不同交通方式碳排放贡献,从而采取针 对性的减排措施。但其不足在于数据需求较多,且分散在不同部门、企业等, 获取数据难度大。 3.全生命周期法 即依据不同交通工具从生产到淘汰的这个生命周期耗能计算交通碳排放 量。其优点在于能够全面反应各种交通工具全生命周期能耗情况。但其不足同 样是由于数据获取涉及多学科、多环节、多部门,计算复杂,误差较大。 (二)碳排放预测方法 在交通运输业碳排放研究中,国内外学者把关注点放在碳排放预测方面, 并开展了很多研究,主要是基于历史数据的统计分析和建模,利用时间序列分 3 析、回归分析等方法对交通碳排放量进行预测。其次是通过建立交通运输系统 的物理模型,分析交通系统中各种因素的作用和交互关系,从而预测交通碳排 放量。以上模型在不同的应用场景中都有着广泛的应用,但是随着社会的发 展,迫切需要提高预测的精度,以神经网络等新兴的机器学习算法和模型应运 而生。利用机器学习模型能够克服传统模型精度不高、难以考虑多因素影响等 问题。近年来,学者们逐渐将机器学习方法应用到交通运输碳排放的预测中, 包括深度学习(DL)、支持向量机(SVM)、人工神经网络(ANN)等,极大促进 了交通运输行业碳减排行动。 (三)交通碳排放研究区域 在研究区域上,基于目前文献,交通运输业碳排放研究在国家、省市级层 面都有涉及。但是相比较来说,针对某一特定城市的研究还较少。上海是我国 交通最发达的城市之一,其交通网络对于我国城市交通而言具有代表意义,但 对于上海交通运输业碳排放的既有研究数量少且研究方向单一。自 2012 年成为 国家低碳试点城市以来,市政府不断提升交通节能减排水平,在交通减排方面 已颇有成效,但依然存在较大的碳减排潜力及改进空间。 本文以上海市交通运输业为研究对象,紧扣碳达峰、碳中和目标,通过选 用 IPCC“自上而下”法探究上海碳减排面临的现实困境,以期找出最适合上海 城市交通碳减排的现实路径,进而为全国城市交通碳减排提供经验。 4 三、研究思路和创新点 (一)研究思路 图 2 技术路线图 5 (二)创新点 1.提高模型泛化能力和鲁棒性。运用了较大数据集合,对交通运输业碳排放 影响较大的可能变量进行筛选,使预测模型更加精确,使之适合上海市的实际。 2.通过机器学习算法对上海市的碳排放量进行预测,并通过情景分析模拟上 海市碳达峰,更好对上海市减碳助力。 3.考虑交通碳排放影响因素的动态变化。以往学者多依据时间序列特性和截 面特性,对碳排放进行分析。本文设定各个影响因素未来发生的场景并以此预测 碳排放量,该方法广泛应用在环境保护、政策制定等方面。 四、数据来源与处理 (一)数据的来源 1.交通运输行业能源消耗数据 从 1986 年开始,为了更好地记录中国能源的生产、消费、贸易等方面的数 据,把握能源市场的脉动,实现能源的可持续发展,同时为政府决策、企业运 营和学术研究提供思路,国家统计局开始组织编写《中国能源统计年鉴》。初期 由国家统计局工业交通统计司主编;自 2008 年开始,改由国家统计局能源统计 司主编。 本文交通运输行业的能源消耗数据,即 2001-2022 年上海市交通运输行业 的终端能源消耗数据,均摘取自该统计年鉴。 2.社会、经济、交通指标数据 本文综合参考文献以及上海市政府“十四五规划”中提及的交通运输业碳 排放影响因素,选取了 2001-2022 年有关的社会、经济、交通领域的数据,均 来源于上海市统计年鉴、上海市生态环境局、上海市道路运输管理局。 3.能源碳排放相关计算参数 1988 年,联合国环境规划署和世界气象组织建立 IPCC,其作用是在全面、 客观、公开透明的基础上,对世界上有关全球气候变化的现有科学、技术和社 会经济信息进行评估。在其《IPCC 2006 年国家温室气体清单指南 2019 年修订 版》中,更新了能源消耗碳排放计算相关的参数,包含:平均低位发热量、单 位热值含碳量、能源碳氧化率。 6 其电力、热力碳排放计算参数参考《陆上交通运输企业温室气体核算》、 《省级温室气体清单编制指南》(均由国家发展改革委员会组织编写)。 (二)变量的选取 由于数据的可获得性,选取 2001-2022 年有关上海市碳排放量、环保投入、 人均 GDP 等指标作为变量的输入。 表 1 层面 社会 经济 交通 初始指标选取表 选取指标 人均公园绿地面积 (平方米) 人口密度(人/平方公里) 工业废气排放总量(亿标立方米) 货物运输量 (万吨) 旅客发送量 (万人次) 环境保护投入(亿元) 市区人口密度(人/平方公里) 第二产业生产总值 (亿元) 上海市生产总值 (亿元) 社会消费品零售总额(亿元) 燃料类社会消费品零售额(亿元) 天然气年产量(亿立方米) 原油产量(吨) 生铁年产量(万吨) 人均 GDP(元) 能源消费总量(万吨标准煤) 货物运输量 (万吨) 国际标准集装箱吞吐量 (万 TEU) 年末出租车运营总数 (辆) 运营公交车辆数 (辆) 铁路营业里程(公里) 内河航道里程(公里) 公路里程(公里) 交通总客运量(万人) 旅客周转量合计(亿人公里) 交通货运周转量(亿吨公里) 沿海港口货物吞吐量(万吨) 交通运输业从业人员(万人) 7 (三)数据处理 1.变量预处理 变量的预处理通常包括对 2001-2022 年《中国能源统计年鉴》、 《上海市统计 年鉴》、道路运输管理局政务报告中所需数据的缺失值、异常值处理。其中缺失 值处理通常采用删除数据、数据插补、不处理等方法;异常值可剔除、视为缺失 值、平均值修正等方法。 为使数据更加完整、准确,提高后期预测的精准度。本文通过对空缺数据、 异常数据邻近五个数据取平均值进行填充。例如,在能源统计年鉴数据中“其他 煤气”数据列 2001 年、2004 年数据缺失,按照最近五年的“其他煤气”数据平 均值进行补充,其填补的缺失值分别为 0.184、0.152。 2.数据归一化 数据归一化常用在数据分析与挖掘中,目的在于消除不同数据间量纲的影 响,将不同特征之间的数据范围统一到相同的尺度上,使后续分析更加稳定且 有效。常用的数据归一化方式有:min-max 标准化法,也称为离差标准化,保 留原来数据中存在的关系,是最常见到的归一化方法;Z-score 标准化法,也 称标准差标准化,是用的最多的标准化方法,但容易受到离群值的影响;小数 定标规范化法,即移动小数点位置,将数据范围移动到[-1,1]之间。 本研究采用 min-max 标准法,将数据范围映射到[0,1]之间。其转换公式 如下所示: 𝑥̇ = 𝑥 − 𝑥𝑚𝑖𝑛 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 公式(1) 其中:𝑥𝑚𝑎𝑥 为相同数据特征中的最大值,𝑥𝑚𝑖𝑛 为相同数据特征中的最小 值。 (四)交通碳排放计算 1.碳排放核算边界 交通运输行业的碳排放核算属于全行业碳排放核算的一部分,由于交通运输 行业划分的模糊性,导致交通运输业的能源消耗统计也存在一定的差异。交通运 输业包含了交通运输基础设施的碳排放,车、船、飞机等交通运输工具的碳排放 以及交通运输中的电力、热力消耗所产生的碳排放。其中交通基础设施建设及维 护中产生的碳可能被归于建筑等行业的碳排放中。交通运输工具中包含公共交通 8 工具和私人交通工具,私人交通工具中又包含大量的摩托车等交通工具的碳排放, 其碳排放计算复杂。在电力,热力的消耗所排放碳中,由于新能源电车的用电量 计算、铁路机车的热力用量计算都存在难以分清其碳核算排放边界的问题。因此, 本研究选取了《中国能源统计年鉴》中的交通运输、仓储和邮政业的终端能源消 耗数据,并将二氧化碳排放量视为交通运输业的碳排放指标,以提升研究的科学 性和可信度。 2.碳排放测算 ①化石能源碳排放测算 本文根据 IPCC(联合国政府间气候变化专门委员会)碳排放核算公式测算 上海市交通碳排放量。 IPCC 公布的碳排放核算方法有两种: “自上而下”法和“自下而上”法。本 文采用“自上而下”法计算交通能源碳排放。其计算公式如下所示: 𝐸 = ∑ 𝐴𝐷𝑖 × 𝐸𝐹𝑖 公式(2) 𝐴𝐷𝑖 = 𝑁𝐶𝑉𝑖 × 𝐹𝐶𝑖 44 E𝐹𝑖 = 𝐶𝐶𝑖 × 𝑂𝐹𝑖 × 12 公式(3) 公式(4) 其中:𝐸为能源碳排放量;𝐴𝐷𝑖 为第 i 种能源的消耗量;𝐸𝐹𝑖 为第 i 种能源 的二氧化碳排放因子。式(3)中:𝑁𝐶𝑉𝑖 为第 i 种能源的平均低位发热量;𝐹𝐶𝑖 为第 i 种能源消耗量。式(4)中:𝐶𝐶𝑖 为第 i 中能源的单位热值含碳量;𝑂𝐹𝑖 为 第 i 种能源的碳氧化率,以%表示;44/12为二氧化碳与碳的分子量之比。 ②电力及热力碳排放计算 根据《陆上交通运输企业温室气体核算》及《省级温室气体清单编制指 南》提供的电力以及热力碳排放计算公式,依靠交通运输行业的电力、热力消 耗量,计算其碳排放量。其计算公式如下所示: 𝐸电力 = 𝐴𝐷电力 × 𝐸𝐹电力 公式(5) 𝐸热力 = 𝐴𝐷热力 × 𝐸𝐹热力 公式(6) 式(5)中:𝐸电力 为使用电力 CO2 排放量,单位吨(tCO2);𝐸𝐹电力 为区域电 网供电平均 CO2 排放因子,单位为吨 CO2/兆瓦时(tCO2/MWh),本文选取华东区 域供电平均 CO2 排放因子 0.928Kg/KW.h;𝐴𝐷电力 为区域电网消耗量,单位为兆瓦 9 时(MWh);式(6)中:𝐸𝐹热力 为供热 CO2 排放因子,单位为吨 CO2/百万千焦(Tco2/GJ), 本文依据清单,按照按 0.11tCO2/GJ 计;𝐴𝐷热力 为核算期内热力消耗量,单位为 百万千焦(GJ);𝐸热力 为使用热力的CO2 排放量,单位为吨二氧化碳(tCO2); 计算出的上海市交通碳排放变化如图 3 所示: 2001-2022年上海市交通碳排放图 6000 坐标轴标题 5000 4000 3000 2000 1000 0 图 3 上海市交通碳排放图 由图 3 可知,自 2001 年开始,上海市交通碳排放量迅速增加,到 2008 年 后交通碳排放量增速变缓,2015 年后交通碳排放量继续增长。在 2019 年后, 受新冠疫情影响,由于全国地区的封控政策,导致交通、邮政、仓储行业受到 极大影响,行业活动极大减少,交通碳排放量也因此减少。 五、上海市交通碳排放模型构建 (一)建模预处理 1.相关性分析 相关性分析是一种常用的筛选变量方法。通过计算变量之间的相关系数,可 以评估变量与目标变量的相关程度和方向。一般来说,相关系数的绝对值越大, 表示变量之间的关联性越强。在构建回归预测模型中,通过计算变量与目标变量 之间的相关性系数,来筛选出与目标变量高度相关的变量,提高模型的准确性和 鲁棒性。 斯皮尔曼系数适用于计算变量间的非线性关系。基于 2023 年刘慧甜、胡大 10 伟的研究,本研究选用斯皮尔曼相关系数来度量 29 个解释变量与交通运输碳排 放之间的关系以及解释变量之间的相关性。其计算公式如下所示: 6 ∑ 𝑑𝑖2 𝜌 = 1− 𝑛(𝑛2 − 1) 公式(7) 其中:𝑑𝑖 是两个变量对应的等级差,n 为样本总数量。 通过 MATLAB 软件计算其相关系数并做出热力图如图 4 所示: 图 4 相关系数图 为减少数据维度,提高模型的鲁棒性和准确性,更好地预测上海市交通碳排 放量。对变量人均公园绿地面积、人口密度……电力消费量、交通碳排放量编码 为 1,2,3,……30。一般认为当相关系数大于 0.7 的时候,具有相关性。从 29 个 解释变量中选取相关系数大于 0.7 的指标,作为模型构建的自变量,共计 21 个。 2.数据集处理 将数据样本随机划分为 80%训练样本,20%的测试样本并作为输入数据集进 行模型的构建,能够避免模型出现过拟合,增强模型的稳健型。 (二)基于神经网络的交通碳排放模型 1.BP 神经网络 BP 神经网络是基于误差逆向传播算法的多层前馈神经网络,其结构如图 5 所示。它是一种具有三层或三层以上的多层神经网络,每一层通过多个神经元 11 连接组成。输入的数据通过输入层,经过赋予权重和设置阈值,输出到隐藏 层,再由隐藏层赋予新的权重和阈值,输出结果到输出层。当输出层得到的误 差过大,则数据会由输出层返回到输入层,经过不断修正网络权重和阈值,使 误差函数沿负梯度方向下降,直到误差达到可接受误差范围内。 图 5 BP 神经网络结构图 为使神经网络更加精准,神经元的输出值会经过一个激活函数,如 sigmoid 函数,将其映射到一定的范围内,以保证输出值的非线性特性。其函数表达式为: 1 𝛿(𝑥) = 公式(8) 1 + 𝑒 −𝑥 在网络正向传播中,通过确定一个目标函数,使输出结果与实际结果之间的 误差更小,提高网络预测精准度。其目标函数就是损失函数 Loss: 𝑛 1 1 𝐿𝑜𝑠𝑠 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2 = ∑[𝑦𝑖 − (𝑤𝑥𝑖 + 𝑏)]2 2 2 𝑖=1 𝑖=1 12 公式(9) 通过 MATLAB 神经网络拟合工具箱,进行交通碳排量的拟合。不断调试网络 的迭代次数、学习速率、训练目标最小误差。输出结果如图 6 所示: 图 6 BP 神经网络预测对比图 通过拟合图像,发现 BP 神经网络的拟合效果并不好。可能由于样本量较小, 交通碳排放量与各变量之间为非线性关系,BP 神经网络容易陷入局部最优解, 导致 BP 神经网络难以准确反映他们的关系。需要进行改进,本文引入遗传算法 对 BP 神经网络进行优化。 2.基于遗传算法优化的 BP 神经网络 遗传算法通过模拟自然界遗传机制和生物进化论而形成的一种随机搜索最 优化的方法。将需优化参数进行编码,依照适应度函数通过遗传中的选择,交叉 和变异对编码个体进行筛选,选出适应度更好的个体。新的个体继承上一代优秀 特征并进行优化。直到满足适应度函数,选出最优参数。 BP 神经网络由于初始权重和阈值的影响,容易陷入局部最优解,导致模型 拟合度不高。通过引入遗传算法对神经网络进行权重和阈值、学习率的优化能够 提高网络的拟合、泛化能力。 其模型步骤为:1.BP 神经网络结构的确定;2.遗传算法优化权值和阈值; 3.BP 神经网路训练及预测。 13 通过 MATLAB 软件,调整 GA 的相关参数,最大迭代次数为 10000,误差阈值 为 0.0001,学习率为 0.01,遗传代数为 50,种群规模为 5。运行结果如图 7 所 示: 图 7 GA-BP 神经网络预测对比图 由图 7 可知,经过遗传算法优化的 BP 神经网络,其预测值更加接近真实值。 通过比较模型 RMSE,优化后模型的均方根误差减少 48.89%。优化后的模型对交 通碳排放的拟合回归效果大幅度提升。 图 8 GA-BP 神经网络训练效果图 14 由图 8 可知,在训练集拟合程度为 0.99907 接近于 1,拟合程度好。由于模 型可能因为与训练集数据出现过拟合情景,因此验证模型好坏的重要指标通常为 验证集的 R,由运行图可以看出,其 R=0.99782 接近于 1,表明模型在未知数据 集上的预测值与真实值接近,模型具有较强的适用能力。 3.RBF 神经网络 RBF 网络和 BP 网络结构类似,通常包括输入层,隐藏层和输出层。不同于 BP 网络使用 sigmoid 函数作为隐藏层激活函数,RBF 使用径向基函数作为激活 函数。其训练方法,不再是 BP 网络中的利用损失函数来调整权重,而是通过调 整隐藏层神经元中心和宽度等来优化权重。RBF 神经网络擅长处理非线性问 题,能够逼近任意非线性函数,在特定数据集的处理上可能会有更好的效果。 简单的径向基神经网络模型如图 9 所示: 图 9 RBF 神经网络结构图 RBF 的激活函数是以输入向量和权重向量之间的距离作为自变量,即 ||dist||作为自变量,b 作为阈值,其激活函数一般表达式为: 𝑅(‖𝑑𝑖𝑠𝑡‖) = 𝑒 −‖𝑑𝑖𝑠𝑡‖ 公式(10) 一般选取隐藏层的激活函数为高斯函数: − 1 𝑓(𝑥) = 𝑒 2𝜎2 其中:σ为高斯函数的方差 15 𝑥2 公式(11) 通过训练得到模型的拟合结果如图 10 所示: 图 10 RBF 神经网络预测结果对比图 由图 10 可知,在 RBF 神经网络下,其 RMSE 均方根误差相比遗传算法优化 的神经网络更小。基于文献查找,这是由于 RBF 神经网络具有处理非线性问题 的较强逼真能力,能够更好地拟合非线性模型,相比于 BP 神经网络具有先天的 优势。同时,RBF 神经网络的训练不依靠梯度下降优化方法,它相比于 BP 神经 网络,其训练更加稳定,避免了断崖式消失或增长的问题,从而能使模型训练 效果更佳。 (三)基于支持向量机回归的交通碳排放模型 1.普通支持向量机回归 支持向量机回归模型(SVR) ,是专门针对小样本问题而提出的,可以在有 限样本的情况下获得最优解。利用 SVM 算法最终可以将问题转化成一个二次规 划问题,得到全局最优解,从而解决了传统 BP 神经网络无法避免的局部最优问 题。支持向量机回归可以理解为找到一个多元回归函数,从给定的数据集合中 预测未知特征数据的输出值。SVR 的一般模型为: 𝑓(𝑥) = 𝜔𝑇 𝜙(𝑥) + 𝑏 公式(12) 其中:𝑓(𝑥)为线性回归函数;𝜙(𝑥)为映射函 数;ωT 为 ω 的转置,ω 与b 均为未确定的参数。 在实际问题的预测回归中,会出现不可避免的误差,假设 SVR 能允许的预 16 测值与真实值之间的误差为ε,即相当于以真实值为中心构造一个宽度为 2ε 的可接受误差带,在此区域内的预测值,被认为是正确的。其示意图如图 11 所 示: 图 11 SVR 示意图 则 SVR 问题转化为: 𝑚 1 2 𝑚𝑖𝑛 ‖𝜔‖ + 𝐶 ∑ 𝑙𝜀 [𝑓(𝑥𝑖 ) − 𝑦𝑖 ] 𝜔,𝑏 2 公式(13) 𝑖=1 其中:𝑙𝜀 为引入的不敏感损失函数;C 为常数;m 为自变量的个数;𝑓(𝑥𝑖 )为 预测值;yi 为真实值。 引入松弛变量𝜁𝑖 、𝜁̂𝑖 ,并使用拉格朗日乘子𝑢𝑖 、𝑢̂𝑖 、𝑎𝑖 、𝑎̂𝑖 ,且均≥0: 𝑚 𝑚 𝑚 𝑖=1 𝑖=1 𝑖=1 1 𝐿(𝜔, 𝑏, 𝑎, 𝑎̂, 𝜉, 𝜉̂, 𝜇, 𝑢̂) = ‖𝜔‖2 + 𝐶 ∑(𝜉𝑖 + 𝜉̂𝑖 ) − ∑ 𝜇𝑖 𝜉𝑖 − ∑ 𝑢̂𝑖 𝜉̂𝑖 + 2 𝑚 𝑚 ∑ 𝑎𝑖 [𝑓(𝑥) − 𝑦𝑖 − 𝜀 − 𝜉𝑖 ] + ∑ 𝑎̂𝑖 [𝑦𝑖 − 𝑓(𝑥𝑖 ) − 𝜀 − 𝜉̂𝑖 ] 𝑖=1 公式(14) 𝑖=1 令 ω、b、𝜁𝑖 、𝜁̂𝑖 的偏导均为0,得到 SVR 的对偶问题,带入一般模型 中,则其目标函数为: 𝑚 𝑓(𝑥) = ∑(𝑎̂𝑖 − 𝑎𝑖 ) 𝐾(𝑥, 𝑥𝑖 ) + 𝑏 公式(15) 𝑖=1 其中 K(x,𝑥𝑖 )为核函数,本文选取高斯径向基函数作为核函数: 17 𝐾(𝑥, 𝑥𝑖 ) = 𝑒𝑥𝑝 (− ‖𝑥 − 𝑥𝑖 ‖2 ) 2𝜎 2 公式(16) 其中:σ为径向基函数的带宽。 通过 MATLAB 软件,取其惩罚因子为 4.0,径向基函数参数为 0.8,输出最 优训练模型如图 12 所示: 图 12 支持向量机预测对比图 由图 12 可知,模型预测效果较好,其真实值和预测值间的误差变小。基于 文献查找知,在小样本的预测回归中,支持向量机具有较大优势,同时将自变 量与碳排放量之间的非线性关系能更好地表现出来,帮助建立更加准确的交通 碳排放预测模型。 2.基于粒子群优化的支持向量机回归 粒子群优化算法是一种基于群体智能搜索的优化算法,通过模拟鸟群在觅 食过程中的迁徙和群聚行为,来搜索最优解。在粒子群算法中,每一个个体被 当做粒子,并在可行解空间中搜索最优解。每个粒子根据自身获得的经验和群 体的经验,更新自己的位置和速度,从而最快获得食物,即求得最优解。其训 练过程和遗传算法(GA)类似: ①初始化粒子群,每个粒子位置和速度不同 ②依据适应度函数,对粒子位置进行筛选,获得个体/群体最优位置 ③根据最优位置更新其他粒子的位置和速度 18 ④不断重复,直到到达条件即停止 通过不断调整参数,选取最优参数,运行模型十次后,最优回归拟合结果 如图 13 所示: 图 13 PSO-SVM 预测结果对比图 由图 13 可知,粒子群优化下的支持向量机的泛化能力得到进一步提升,相 对于普通的支持向量机回归,其 RMSE 均方根误差减少约 5%,R2 =0.989,说明模 型拟合效果在传统支持向量机上得到进一步改善,这也证明了在粒子群优化作 用下,能较大幅度提高模型的泛化能力,以获得更佳的预测模型。 (四)模型的评价 1.模型评价指标 机器学习模型评价的指标很多,常用包括均方根误差(RMSE)、R 平方(Rsquared)、准确率、召回率等。本文选用均方根误差和𝑅 2 来评估以上模型对交 通碳排放量的预测效果。对于均方根误差(RMSE)其值越小,则模型效果越 好;𝑅 2 越接近于 1,其模型效果越好。 模型的训练数据经过归一化和反归一化后,均方根误差越小,则模型拟合 效果越好。𝑅 2 的绝对值越接近于 1,模型的拟合效果越好。 2.模型评价分析 机器学习模型 BP 神经网络 表 2 模型 RMSE、𝑅 2 对比表 均方根误差 255.88 19 𝑹𝟐 0.875 基于 GA 的神经网络 RBF 神经网络 支持向量机 基于 PSO 的支持向量机 130.86 0.04 38.94 35.51 0.925 0.998 0.977 0.989 由表 2 可知,传统 BP 神经网络的拟合效果最差,其 RMSE=255.88,对其使 用遗传算法进行优化以后,均方根误差减少 48.9%,说明遗传算法能够让 BP 神 经网络的拟合效果得到改善,跳出局部最优解,但是由于其算法本身更加适用 于大样本预测,面对变量间非线性关系处理能力较弱,从而导致误差依旧较 大。而适用于小样本的 SVR 回归,能把变量间的关系通过线性——非线性之间 的反复转化,其传统支持向量机的 RMSE=38.94,两者相比较,为小样本的回归 预测提供了实例证明。 对于 RBF 神经网络,通过其径向基激活函数,相当于结合了神经网络与支 持向量机的优点,将小样本数据输入映射到高维空间,更好捕捉数据的非线性 关系,具有一定的灵活性和泛化能力。通过研究表明,RBF 神经网络在对交通 碳排放的回归预测中效果优于传统 BP 神经网络、遗传算法优化的 BP 网络、支 持向量机回归以及粒子群优化的支持向量机回归。 六、基于情景分析预测交通碳达峰时间 (一)情景分析法介绍 情景分析法是一种用于分析在预先设定的假设情景或环境的作用下,对未 来的变化趋势做出预测和描述,从而指导决策者进行行为优化。情景分析法广 泛应用于社会科学研究、市场调研、政策制定、组织行为研究等研究场景。 (二)变量重要性分析 使用情景分析法研究未来碳排放变化趋势,需要根据变量的重要性对其作 出假设。重要性绝对值越大,说明其对碳排放量的影响程度越大;重要性为 正,说明因素与碳排放量变化相同,即正相关;重要性为负,说明因素与碳排 放量变化相反,即负相关。 20 随机森林是一种集成学习算法,可以用于回归和分类问题,也可以计算变 量的重要性。通过 MATLAB,求得变量的重要性如图 14 所示: 图 14 变量重要性图 由图 14 可得,所有变量的重要性都大于 0,其中能源消费总量的重要性最 大,交通运输从业人员的重要性最小。重要性大于 0.2 的变量有:旅客发送 量、社会消费品总额、燃料类社会消费品零售额、汽车产量、公路里程、交通 总客运量、沿海港口货物吞吐量、常住人口数、能源消费总量。这些变量的增 加对交通碳排放量的促进作用较大,通过控制以上变量可以减缓交通碳排放量 的增长,直接或间接为政策制定作指导。 (三)交通碳排放的情景设定 本研究运用情景分析法的目的是:根据第五章得到的最优碳排放预测模型 (RBF 神经网络),改变影响碳排放的自变量,分析出变量的变化对交通碳排放 的影响,并基于此影响,研究上海市交通碳排放的碳达峰时间,进行预测和模 拟。 情景设定通常包括两类基本方案: ①基准情景 即不管是决策对象还是决策要素都保持历史发展状态,不需要 促使其变化,相当于对照组。 ②优化情景 即对于不同的决策,为实现优化决策要素,设定不同变量短期 和长期关系及趋势变化来形成不同的情景方案,相当于实验组。 21 1.基准情景下的碳排放 基准条件下,即依照变量历史的发展状态,计算其未来交通碳排放量。依 据 2015-2022 年的各变量变化平均值作为基准变化,并带入模型。交通碳排放 量如图 15 所示: 基准情景下交通碳排放预测 9000 碳排放量(万吨) 8000 7000 6000 5000 4000 3000 2000 1000 0 2022 2024 图 15 2026 2028 2030 2032 2034 2036 2038 2040 基准情景下交通碳排放预测图 由图 15 可知,在基准条件下,交通碳排放量持续增长,碳排放量增长率较 小,但一直未出现碳达峰趋势。“双碳”目标提出在 2030 年实现“碳达峰”与 2060 年实现“碳中和”,上海市在“十四五规划”中提出力争在 2025 年前完成 碳达峰,这需要各行各业为“碳达峰” 、“碳中和”而努力。而在此基准条件 下,上海市交通碳排放量持续增加,说明需要对其进行优化,改变因素的变化 程度。 2.优化情景下的碳排放 2021 年上海市两会期间,上海正式提出,要在 2025 年前实现碳达峰,比 全国所制定的 2023 年实现碳达峰提前了五年。目前上海正在制定碳达峰的行动 方案。在《上海市生态环境保护“十四五”规划》提出,上海将力争 2025 年碳 排放总量到达峰值。 上海市实施能源消费总量和强度双控,着力于推动电力、钢铁等重点用能 单位实现节能降碳,继续推动能源清洁高效利用,实施对重点企业煤炭消费总 量的控制,以使上海市煤炭消费进一步减少。 上海市“十四五”规划中,提出要进一步推进“碳减行动”,推行工业清洁 生产,交通节能减排;推动产业结构转型升级,交通运输结构调整;推动石 22 化、钢铁产业绿色发展;还号召全社会采用绿色生活方式,推行绿色出行,推 广节能环保低碳产品。 考虑到越接近 2025 年,上海市推动碳排放达峰的措施越有力。建立以下动 态因素变化表,以此探究上海市交通碳排放量的未来变化情况。考虑到各因素 对碳排放影响程度不同,为简化模型,设定各因素变化程度相同。 设定从 2023-2030 年,各因素变化程度逐年递减,分别为上一年的 98%、 97%、96%、95%、94%、93%、92%、91%。 优化情景下交通碳排放预测 4300 碳排放量(万吨) 4200 4100 4000 3900 3800 3700 3600 2022 2023 2024 图 16 2025 2026 2027 2028 2029 2030 2031 优化情景下交通碳排放预测图 由图 16 可知,在此优化情景下,随着政策力度的加强,上海市交通碳排放 量预计将在 2025 年前抵达峰值,随后碳排放量迅速下降,这正是前期减排政策 的累积作用,为上海市政府在“十四五规划中”预期的 2025 年碳排放达峰做出 了贡献。 七、结论与建议 (一)总结 本文围绕 IPCC 公布的碳排放“自上而下”核算法,计算上海市交通碳排放 量,并根据经济、社会、交通等指标构建预测模型。结合当前人工智能热点, 聚焦大数据+机器学习的方法,采用神经网络、支持向量机及其改进模型或算 法,建立了更准确的上海市交通碳排放回归预测模型,并基于模型结合情景分 析法,进行上海市交通碳达峰研究,并得出以下结论: 1.根据计算得到的相关性系数,筛选出与交通碳排放量相关程度大于 0.7 23 的 21 个变量,并剔除弱相关变量或边缘变量。通过变量筛选得到的变量能减少 冗杂数据,提高模型的稳健性。 2.交通碳排放研究总体上适合选用在小样本、非线性数据处理上有优势的 模型,如支持向量机模型和 RBF 神经网络模型。其中 RBF 神经网路模型结合了 小样本、非线性、避免局部最优的特性,在上述碳排放预测模型中泛化能力最 好。 3.根据情景分析法,如果按照历史的发展状态则上海市交通碳排放难以在 2025 年前实现碳达峰;当在优化情景下,依据动态变量表,有望在 2025 年实 现交通碳排放达峰。 (二)政策建议 1.加快智能化碳排放检测。本研究由于数据的可获得性,导致在数据采集 量上仍然有所欠缺,已有变量对碳排放量的解释程度可能不是非常准确。通过 加强智能化碳排放检测,可以清晰明了地找到碳排放的组成,分析各个因素的 碳排放贡献程度。依据其贡献度,可以对影响碳排放较大的因素实行管控,避 免了耗费大量财力、精力而在碳排放管控上乏力。同时,通过智能化的检测, 可以为制定碳减排政策提供科学的支持,让政策都能发挥最大效益,提高政府 的决策效率。 2.加快交通运输绿色转型。上海市政府提出在 2025 年前实现公共交通运输 工具、公务车等新能源替换,大力发展新能源汽车。汽车产量、公路运营里 程、铁路运营里程对交通碳排放量的重要程度均为 25%左右。实现交通运输业 的绿色转型,能够有效控制碳排放,进而完成碳达峰目标。 3.合理规划城市建设。随着城市化进程与减碳行动相结合,同时伴随着上 海市临港新城等建设,城市人口密度、市区人口常住数、人均 GDP 可能会有所 减少。在情景分析中,通过以上变量每年的阶段性递减,上海市交通碳排放量 得到有效控制。政府应该采取宏观举措,积极引导城市化建设进程,把握好经 济与环境之间的关系。 24 (三)研究局限与展望 本文基于历史数据和机器学习算法,对上海市交通碳排放进行研究及预测 分析,虽取得了一些进展,但仍然存在一定的发展空间,有待进一步的研究: 1.由于数据获取的原因,选取的变量不足。 2.本研究运用机器学习输入的特征较少,由于交通碳排放的复杂性,无法 全面综合地体现出所有的影响因素,具有局限性。 3.随着社会的发展,各行各业的智能化水平不断提高,未来对碳排放各影 响因素的检测将越来越全面,能够提高预测模型的准确性和适用性。 25 参考文献 [1] 刘慧甜,胡大伟.基于机器学习的交通碳排放预测模型构建与分析[J/OL].环 境科学:1-17[202404.24].https://doi.org/10.13227/j.hjkx.202305234. [2] 杨君. 中国交通运输业碳排放测度及减排路径研究[D].江西财经大学,202 3.DOI:10.27175/d.cnki.gjxcu.2022.000478. [3] 张志捷. 碳达峰约束下中国交通运输行业碳排放预测研究[D].长安大学,20 23.DOI:10.26976/d.cnki.gchau.2023.001121. [4] 杨东,李艳红,田春林.交通运输行业碳排放自然达峰特征与峰值预测研究[J /OL].交通运输系统工程与信息:1-17[2024-04-24].http://kns.cnki.net/ kcms/detail/11.4520.U.20240226.1543.004.html. [5] 孙岩,张昱,刘学敏.北京市交通碳排放的驱动因素分析——基于城市发展视 角[J].城市与环境研究,2020(01):81-95. [6] 江辰星. 城市低碳交通测算模型及策略研究[D].华东理工大学,2023.DOI:1 0.27148/d.cnki.ghagu.2022.000179. [7] 李慧瑶. 河北省交通运输业碳排放影响因素及预测研究[D].石家庄铁道大 学,2023.DOI:10.27334/d.cnki.gstdy.2023.000972. [8] 王鑫鑫,沈晓攀,王琪,等.基于LSTM-RBF的水路货运量预测[J].科学技术与 工程,2023,23(18):7995-8001. [9] 焦业峰. 基于改进支持向量机的风电功率短期预测方法[D].江南大学,202 3.DOI:10.27169/d.cnki.gwqgu.2023.001851. [10] 李婷婷. 基于机器学习的工厂化水产养殖水质模拟预测[D].鲁东大学,202 3.DOI:10.27216/d.cnki.gysfc.2023.000214. [11] 宋伟雪. 基于机器学习的建筑业二氧化碳排放预测模型研究[D].西安建筑 科技大学,2021.DOI:10.27393/d.cnki.gxazu.2020.000578. [12] 史丹,叶云岭.城市交通碳排放趋势与减排对策研究——以上海市为例[J]. 现代管理科学,2022(04):3-14. 26 附录 常用化石燃料相关参数缺省值 能源名称 计量单位 平均低位发 单位热值含 热量 碳量 (KJ/KG) (t/GJ) 碳氧化率 原煤 t KJ/m³ 20908 27.4×10-3 94% 汽油 t 43070 18.9×10-3 98% 煤油 t 43070 19.6×10-3 98% 柴油 t 42652 20.2×10-3 98% 燃料油 t 41816 21.1×10 -3 98% 液化石油气 t 50179 17.2×10-3 99% 天然气 10⁴Nm³ 38931 15.30×10-3 99% 其他煤气 10⁴Nm³ 52270 12.2×10-3 99% 其他石油制 10⁴Nm³ 41816 20.0×10-3 98% 品 27