计算政治学的形成与发展.pdf
《计算政治学的形成与发展.pdf》由会员分享,可在线阅读,更多相关《计算政治学的形成与发展.pdf(14页珍藏版)》请在咨信网上搜索。
1、2023 年第 2 期 总第 6 期新文科理论与实践No.2,2023Serial No.6Journal of New Humanities and Social Sciences计算政治学的形成与发展李锋王浦劬摘要:在新技术时代,随着政治学研究对象和政治环境的变化,政治学研究的方法和范式持续更新,形成了计算政治学的新范式。随着计算机获取数据能力的提升、算法的逐步优化、算力的日益增强和用户界面的友好化,计算政治学的研究范式也不断发展,形成了大数据政治学、智能体仿真模拟和计算实验等研究方法。大数据政治学可以运用自动文本分析、机器学习等方法分析海量的、类型多元的、实时互动的政治数据。智能体仿真模
2、拟的仿真能力不断提升,能够更好地设定与调整参数、分析智能体与复杂环境系统的互动。计算实验依托互联网政治实践,能够较好解决传统实验研究中干预困难和外在效度不足的问题,更好地探索互联网政治行为和规律。关键词:计算政治学;大数据政治学;智能体仿真模拟;计算实验;机器学习DOI:10.20066/ki.37-1535/G4.2023.02.06一、引言:新技术时代下的计算政治学习近平总书记指出,“与以往历次工业革命相比,第四次工业革命是以指数级而非线性速度展开”。第四次工业革命本质上是信息革命,核心特征是计算机技术、互联网技术科学的深入发展和持续升级。随着第四次工业革命的发展,人类生产生活方式和组织方
3、式、运行价值发生深刻变化,引发了社会科学研究范式、研究工具的重大变革。一般来说,研究范式是通过学术研究方法、研究问题的学术评价标准等要素表现出来的,它体现着学科内容和方法的统一,常常被认为是新学科形成的标识。政治学以政治现象及其发展规律为研究对象,在不同的技术时代,政治现象形态及其环境等具有很大差异性。关注的问题不同,相应研究也显示出不同的特征。在第四次工业革命过程中,计算机的运力不断提升,计算机应用软件界面愈益简单,研究方法和工具不断更新,大量研究者有意识地应用新的计算方法作者简介:李锋,中央党校政治和法律教研部副教授,中央党校习近平新时代中国特色社会主义思想研究中心研究员,北京大学国家治理
4、研究院副研究员(北京 100091);王浦劬(通讯作者),北京大学习近平新时代中国特色社会主义思想研究院院长,北京大学国家治理研究院院长、政府管理学院教授(北京 100871)基 金 项 目:本 文 系 国 家 社 会 科 学 基 金 重 大 研 究 专 项 项 目“新 时 代 中 国 特 色 政 治 学 基 本 理 论 问 题 研 究”(18VXK003)、国家社科基金青年项目“大数据背景下地方政府回应性实证研究”(20CZZ017)的阶段性成果。习近平:论把握新发展阶段、贯彻新发展理念、构建新发展格局,北京:中央文献出版社,2021年,第 176页。李强:“大数据社会科学”专题主持人语,清
5、华大学学报(哲学社会科学版)2015年第 3期。计算政治学的形成与发展来分析政治现象和议题,形成了计算政治学的研究方法和范式,标志着计算政治学的问世。计算政治学(Computational Politics)是计算社会科学(Computational Social Sciences)的一个分支,属于计算科学与政治学的交叉学科。它基于计算社会科学的方法论,利用不断扩展的多源异构的海量大数据、日益增强的算力和逐步优化的算法,来研究政治行为与话语实践,形成了大数据政治学、智能体仿真模拟和计算实验等多种计算政治学的研究形态。大数据政治学的出现,使得许多政治学研究者可以直接分析海量的文本信息、图像、视频
6、和社会网络信息等非结构化数据,探索分析新的研究议题,并为传统议题研究提供新方法。智能体仿真模拟也成为计算政治学的重要分析方法,在当前能够更简单地设定参数、调整参数,更好地分析主体与环境的互动关系。此外,更多的政治现象在计算机和网络平台出现,也为研究政治行为提供了更多创新 性 场 域。例 如,人 工 智 能 实 验 室 OpenAI 在 2022 年 11 月 发 布 了 ChatGPT,可 在 提 示 词(prompt)的引导下生成文本,也可以用来生成大量政治话语,这为研究新技术条件下的政民互动形态提供了新的机制性可能,而元宇宙等新兴技术也为计算政治学提供了新的研究议题。二、从政治算数到计算政
7、治学从计算的角度研究政治学并不是 21 世纪的新发明。随着现代自然科学的发展,人们一直希望能够运用像数学、物理那样的自然科学的范式来研究社会问题。格劳秀斯就试图以模仿数学的方式来建构新的社会科学。配第在 政治算数(Political Arithmetick)中希望通过数学算式规则来更好地实现人的幸福,强调在政治学中引入数学计算,创建以“数学”为基础的国家科学,用数学工具来揭示治国方略的规律。配第使用大量统计资料,研究工业革命后资本主义生产的内在流通和生产过程。马克思认为,配第所创立的“政治算术”是“政治经济学作为一门独立科学分离出来的最初形式”。19世纪末 20 世纪初,实证主义、科学主义思潮
8、极大地影响了政治学的发展。人们认为,政治学应与自然科学一样,采用归纳和实证方法来研究。20世纪 20年代,美国兴起以“科学主义”为指导的“新政治学运动”,到“二战”后形成行为主义政治学的研究范式。学者们认为,应该通过可观察的政治行为构建政治理论、进行政治分析。但即便在定量研究盛行的美国,因当时的统计硬件和软件滞后于统计理论,政治学者无法直接基于统计理论进行“计算”,大部分实证研究主要是定性分析,以统计为主的定量研究停留在基础方法层面。此后,在大规模数据采集技术形成、计算机分析软件逐步成熟后,政治学定量方法才逐步成为美国政治学统计分析的主流。1975年,Alker 提出 Polimetrics
9、概念,意指通过数学形式、统计技术对观察到的政治现象进行的编码、度量和对政治理论的形式模型(formal model)。但是,这个概念内涵过于丰富,许多非计算的描述(逻辑、集合论、博弈论等)也都归属于此概念,使此概念的使用受到限制。随着人工智能理论的发展,越来越多的学者注意到人工智能对社会的影响,开始强调计算科学对研I 伯纳德科恩:自然科学与社会科学的互动,北京:商务印书馆,2016年,第 139-161页。马克思:政治经济学批判,北京:人民出版社,1976年,第 37-38页。苏毓淞、刘江锐:统计分析方法与美国政治学研究,美国研究 2020年第 3期。Hayward R.Alker Jr,“P
10、olimetrics:Its Descriptive Foundations”,Handbook of Political Science,vol.7(1975),pp.140-210.57新文科理论与实践 2023 年第 2 期究政治现象的作用。1987年,Richard Ennals提出“计算政治”的概念,主张采用并行计算、并行逻辑程序设计语言等方式来解决长期存在并在人工智能时代不断发展的并行与复杂协同问题。麻省理工学院人工智能实验室的 John C.Mallery 指出,应该开辟“计算政治学”的学术领域,开发更好的政治认知理论和计算模型,科学设计评估这些理论和模型的标准,推动国际社会中人
11、工智能系统的作用。罗切斯特大学的 Edith Hemaspaandra 等分析了 1876年刘易斯卡罗尔(Lewis Carroll)提出的一种选举制度。该选举制度是为了解决 18世纪法国思想家提出的“孔多塞悖论”,即认为在选民投票偏好中变动最少的人应该当选。计算科学教授利用计算科学中的算法,确认这种方式虽然在运行中更为复杂,但确实是更好的选举方式。此外,他们还系统分析了选举投票相关的计算和可处理性问题,通过对算法的比较,指出模拟退火算法(Simulated Annealing Algorithm)比美国正在使用的选举计算方式更为科学。新世纪以来,更多学者提出,应该利用计算科学的方式来研究政治
12、和社会现象。许多计算机学者开始分析公共管理与政策过程中的信息处理过程。例如,麻省理工学院计算机科学与人工智能实验室的 Patrick H.Winston 和 Mark A.Finlayson 提出“计算政治学”,一方面帮助政治学学者和政府工作人员找到合适的分析工具来分析日益增多的信息流,以作出更加可靠的决策;另一方面,越来越多的学者指出,在理性行为之上还有很多“非理性”机制影响认知决策,希望能有更好的工具来理解社会环境。但在大数据分析技术出现之前,这些计算学者开发的工具分析能力有限,无法理解复杂的句子。总之,在这个时期,关于计算政治的研究,大多由计算机专业教授发起,他们试图用计算方法分析政治现
13、象。但是他们实际上并未认真分析政治运行过程和机制,而是简单将政治学视为计算科学的应用场景。随着高性能计算显卡出现,算力得到提升,数据采集技术得到新的发展,海量的大数据更容易被政治学者使用和分析,包括 Python等分析软件的出现,进一步促进了计算政治学的发展,计算政治学的重点才由此逐步从“计算”转向“政治”。三、大数据政治学:计算政治学的大数据研究2009年,大卫拉泽尔等十余位来自哈佛大学、麻省理工学院等多所世界知名高校和研究机构的学者在 科学 杂志发表了题为 计算社会科学(Computational Social Science)的文章。文章提出,在新的技术时代,人们的日常生活和经济、政治行
14、为都留下了数字痕迹,而计算机收集和分析大规模数据能力的提升,使得数据驱动的新研究领域即计算社会科学出现。大卫拉泽尔提出并重塑“计算社会科学”的概念,把用大数据研究社会科学的方法定义为计算社会科学。Richard Ennals,“Socially Useful Artificial Intelligence”,AI&SOCIETY,vol.1(1987),pp.5-15.Edith Hemaspaandra,Lane A.Hemaspaandra and Jrg Rothe,“Exact Analysis of Dodgson Elections:Lewis Carroll s 1876 Vot
15、ing System is Complete for Parallel Access to NP”,Journal of the ACM(JACM),vol.44,no.6(1997),pp.806-825.Edith Hemaspaandra and Lane A.Hemaspaandra,“Computational Politics:Electoral Systems”,MFCS 2000(Springer,2000),pp.64-83.Patrick H.Winston and Mark A.Finlayson,“Computational Politics”,MIT Computer
16、 Science and Artificial Intelligence Laboratory,2004,pp.783-784.David Lazer et al.,“Computational Social Science”,Science,vol.323,no.5915(2009),pp.721-723.58计算政治学的形成与发展在政治学领域,利用大数据技术分析采集海量多元数据,就成为大数据政治学。从大数据政治学来说,政治行为的大数据具有 5V 特征,即数据体量(volume)大、数据类型(variety)多、数据收集快(velocity)、数据密度(value)低、数据真实性(verac
17、ity)高,这些特征实质性地影响了政治学的研究方法和研究范式。从数据体量来看,大数据政治学的研究样本不再局限于抽样的“小”数据,而是能够研究不需要抽样的大数据、全数据,数据总规模从 TB(240)级别发展到 EB(260)级别,甚至 ZB(270)级别。在传统的问卷调查阶段,学者基于理论假设,通过结构化问卷对复杂的政治学概念进行操作化处理,利用多种科学抽样方法最大限度地“代表”总体,由此识别政治心理、政治行为等复杂性关联。随着社会发展,依赖面访和概率抽样的实证研究抽样调查成本持续高企,城市小区进入难度提高,无应答率不断提升。计算政治学希望依托大数据直接从“总体”出发,而不需要进行传统的抽样;同
18、时,希望通过大数据分析方法,以强大的算力,对全样本数据进行采集和分析,由此全面地分析公民的政治痕迹数据,减少在抽样环节带来的误差。比如,学者通过对全国性网络问政平台全样本的分析,利用大数据分析技术可以整体把握分时段、分地区面向不同层级政府的诉求特征,而不需要研究者自己按照系统抽样选取部分帖子来进行人工阅读和分析,可以减少主观选择带来的误差。当然,大数据可以不需抽样,并不代表大数据和抽样方法本身互相排斥,在一定程度上,人们可以结合大数据与抽样方法,在全面性和效率之间寻求平衡。从数据类型来看,大数据政治学的数据具有类型多样、多源异构的特征。传统政治学在定量研究中高度依赖结构化问卷,而政治学的概念,
19、如权利、权力、利益等都具有高度复杂性,将这些概念操作化为可定量测量的问卷难度极大,而且不同受访者面对同样的测量问卷会形成参照系偏差,由此产生测量误差。针对这种情况,有学者采取了虚拟情境测量等多种方法,设定多个虚拟情境来体现政治效能感的高低,并让受访者比较自身和虚拟情境中的人物的“效能感”,从而更好地理解“政治效能感”的复杂概念。然而受访者针对概念的理解仍然高度受限于问卷设计。不论问卷调查设计如何复杂,最终调查对象的调查数据都会形成一个结构完全一致的矩阵,调查者更加丰富的信息和内容遭到裁减,信息化约严重,信息失真较多。大数据政治学则可以直接分析类型多元的图像、视频和结构差异大的文本信息,并且综合
20、多源异构的多种数据。例如,利用自动文本分析研究大规模的司法裁判文书,给政治学者观察司法过程提供了良好的契机。通过采集和文本分析获得的司法裁判文书数据,政治学者可以更好地分析司法改革的政治效应,理解行政诉讼在规范公权力、调整政商关系等方面的运行机制。此外,为了更好地感知城市居民对城市规划的主观态度,更好地建设人民满意的城市,城市规划者可以采集多源数据,如利用新浪微博 API采集带有位置信息的微博数据,根据微博上的人脉关系利用聚类规严洁:政治学研究中的抽样调查:难点,问题与方法创新,政治学研究 2018年第 3期。李锋:网络空间公民利益诉求的对象选择与行为特征以全国网络问政平台的大数据分析为例,探
21、索 2019 年第 6期。吕程平:网民留言中的参与性、归属感与自由感人民网 地方领导留言板 10省留言数据分析,中国农业大学学报(社会科学版)2014年第 4期。李锋:虚拟情景锚定法如何提高问卷调查的可比性以公民诉求影响力的测度与分析为例,甘肃行政学院学报2019年第 3期。马超、于晓虹、何海波:大数据分析:中国司法裁判文书上网公开报告,中国法律评论 2016年第 4期。孟天广、李熠:立案登记制改革与行政纠纷解决司法化,中国社会科学院大学学报 2022年第 4期。59新文科理论与实践 2023 年第 2 期则抓取 16000名微博上的规划圈成员的 ID 信息及社交关系,利用 OPEN STRE
22、ET MAP 和兴趣点数据获取用地现状,结合公交一卡通刷卡数据和开放的地理信息资源数据,进行城市研究和规划评估工作。斯坦福大学李飞飞教授利用谷歌街景车收集的 5000万张街景,使用深度学习的视觉技术,估计美国 200个城市地区的社会经济特征,结果显示,根据街区中皮卡车和轿车的数量,可以很好地预测相关人群在总统选举中的党派倾向。这种大数据技术可以高度精确地动态测量经济社会和人口统计特征。从计算政治学的数据收集来看,与传统数据收集过程相比,大数据的收集过程更加便捷,而且可以实时动态采集多地区、多时段数据,这在传统数据采集过程中耗费巨大且难以完成。例如,Macy基于 84 个不同国家 240 万用户
23、在两年内发布的 5.09 亿条 Twitter 帖子来研究不同国家网民的情绪变化,发现人们的情绪在周末和早晨更为积极,这样的研究能够证实许多之前的推论或假设。而且这种收集方法成本更低,有助于推动大数据政治学的发展,帮助学者以数据为资源,以算力为驱动力,来发现传统研究中无法发现的现象,形成基于数据驱动的研究范式。从数据密度来看,大数据的体量较大,其中的有用信息需要进行大量的分析才能获得。但是,数据密度低并不意味着数据价值低,一旦掌握了正确的分析方法,就能得到传统方法无法得到的结论。在 2012 年总统选举的竞选活动中,奥巴马竞选团队在 Facebook 上开发了一个应用程序,吸引可能支持奥巴马的
24、用户使用,在掌握了用户资料后,跟进发动这些选民进行投票。此后,越来越多的公司开始关注与选举相关的社交媒体数据。在 2016 年总统大选中,8700 万Facebook用户数据被泄露给政治咨询公司剑桥分析,被认为较大程度上影响了总统选举结果。由此表明,从低密度的数据中可以挖掘具有高价值的信息资源。从数据真实性来看,许多大数据信息由用户生成,造成数据真伪难辨,影响研究的真实性。但是,从数据获取来说,许多大数据并非研究者的“设计”,而是直接出自用户的自发行为,反映了政治行为主体的行为和话语事件,是真实政治活动中的数据,是一种“发现的数据”,更加接近现实政治实践,且避免引发所谓的实验者“需求效应”和问
25、卷调查中的“社会期许偏差”。此前,问卷数据由受访者自陈,限于问卷结构,问卷的设计和提问过程只能尽可能照顾大多数受访者。同时尽管问卷设计者通过多种方式希望受访者能够更加如实地作答,但问卷调查实际上难以获取部分受访者的真实想法。例如,在传统的实证研究中,研究普通民众的意识形态,通常都是依赖受访者准确、真实地表明主观态度,而这些问题又高度敏感,许多民众倾向于拒绝作答或者隐藏真实态度。在新技术时代,研究者可以利用爬虫技术收集并非出于研究者设计的海量数据,从这些政治行为数据中揭示政治意识形态。有学者基于消费者在亚马逊网站大规模的图书共同购买数据,得到 26 467 385组共同购买的关系,1 303 5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算 政治学 形成 发展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。