太原学院智能与自动化系课程设计报告.docx
《太原学院智能与自动化系课程设计报告.docx》由会员分享,可在线阅读,更多相关《太原学院智能与自动化系课程设计报告.docx(13页珍藏版)》请在咨信网上搜索。
1、薛福名称 专业班级 驳名%号敖师太原老浣窗惚与自劭化系薛程微新想告智能数据挖掘智能科学与技术19-1王炳乾62021-2022 (1)白文江2021年72月宓日pred = predict_winner(teaml, team2, model) prob = pred00if prob 0. 5:winner = teamlloser = team2d(winner, loser, prob) else:winner = team2loser = teamld(winner, loser, 1 - prob)with open(f 1, w) as f:writer = r(f)row(win
2、,lose1, probability) rows(result)print ( done.)#我们实验Pandas预览生成预测结果文件文件:try:pd. read_csv(f f, header=0)except:pass#查看生成csv文件 import csvwithopen (! f) as f:csv 二headersfor rowr (f)=next(f_csv) in f csv:print (row)五、结果及分析L结果:Building data set.X 1700, 27. 2, 32. 0, 50. 0, 33. 0, 49.0, -2. 73, 0. 0, -2.
3、74,104. 6, 107. 6, 93.4,0. 255,0. 256, 0. 527,0. 483,12. 6,23. 7, 0. 205,0. 48700000000000004, 10. 5, 75. 8, 0. 204, 812292. 0,38. 0,85. 8, 0.44299999999999995, 7. 6,22. 4,0, 341, 30. 3, 63.4, 0,479,17. 5, 23. 2, 0,754, 10.9, 33.3, 44.2, 20.8, 7.2, 4.2, 11.3, 18.5,101.1, 36.9,84.0, 0.439, 7.4, 21.5,
4、0.34600000000000003,29.4,62.5,17. 2, 21. 4, 0. 805, 10. 4, 34. 0, 44. 4, 20. o,5. 7,5. 7, 13.4,19. 7, 98. 4, 1600, 28.2, 48.0, 34.0, 51. 0,31.0,3. 61,-0. 12, 3. 49,105. 1, 1Fitting on 1316 game samples.Doing cross-validation.Predicting on new schedule.done.结果1J Indiana Pacers, J7 Houston Rockets, 1
5、Los Angeles Lakers, ,J二 Memphis Grizzlies, , Minnesota Timberwolves,, Charlotte Hornets, Milwaukee Bucks, 0.7690952655343486二Denver Nuggets5f Miami Heat, Orlando Magic, 7 Oklahoma City Thunder, Philadelphia 76ers, 0.7 Sacramento Kings, Phoenix Suns, 0.7258686751709502? Toronto Raptors, 1 Detroit Pis
6、tons*, 0.7535364327866106,Atlanta Hawks5, , Washington Lizards, * 0.630574956949663V Chicago Bulls, Boston Celtics, Los Angeles Clippers, Portland Trail Blazers5,ZSan Antonio Spurs, Sacramento Kings, 7 Indiana Pacers, , Brooklyn Nets, Dallas Mavericks, Houston Rockets5, .0. 5626069950589027 Detroit
7、Pistons1, 1 Orlando Magic, 0.6856948252207253Miami Heat, Charlotte HornetsJ, Golden State Warriors, Oklahoma City Thunder, 1,结果二2 .分析:我们利用的局部统计数据,计算每支NBA比赛队伍的Elo socre,和利用这些基本统计 数据评价每支队伍过去的比赛情况,并且根据国际等级划分方法Elo Score对队伍现在的战 斗等级进行评分,最终结合这些不同队伍的特征判断在一场比赛中,哪支队伍能够占到优势。 但在我们的预测结果中,与以往不同,我们没有给出绝对的正负之分,而是给出
8、胜算较大一 方的队伍能够赢另外一方的概率。当然在这里,我们所采用评价一支队伍性能的数据量还太 少(只采用了 1516年一年的数据),如果想要更加准确、系统的判断。通过本次的课程设 计让我学习到了数据挖掘的分析方法,更加的熟练掌握数据分析的重点。加强巩固了分析的 思维。3 .心得:学习数据挖掘这门课程已经有一个学期了,在这十余周的学习过程中,我对数据挖掘这 门课程的一些技术有了一定的了解,并明确了一些容易混淆的概念,数据挖掘,简单说,就 是从大量的数据中,抽取出潜在的、有价值的知识、模型或规那么的过程。我会继续学习这门 课程,努力为今后的课题研究或论文打好基础。参考文献1方巍,Python数据挖
9、掘与机器学习实战,机械工业出版社,20192邵峰晶于忠清等数据挖掘原理与算法,中国水利水电出版社,20033韩家炜数据挖掘:概念与技术,机械工业出版社20174 4 Margaret H. Dunham数据挖掘教程,清华大学出版社,20055张俊妮,数据挖掘与应用,北京大学出版社,2009import pandas as pdimport mathimport csvimport randomimport numpy as npfrom sklearn import linear.modelfrom _selection import cross_val_score#当每支队伍没有elo等级分
10、时,赋予其基础elo等级分 base_elo = 1600team_elos =team_stats =)X 二 口y 二口# #存放数据的目录folder =data#根据每支队伍的Miscellaneous Opponent, Team统计数据csv文件进行初始化 def initialize_data(Mstat, Ostat, Tstat):new_Mstat = (Rk, Arena, axis=l)new_0stat =(Rk, G, MP, axis=l)new_Tstat =(1Rk1, G, MP, axis=l)teamstatsl = pd. merge(new_Msta
11、t, new_0stat, how=left, on=,Team*) team_statsl = pd. merge(team_statsl, new_Tstat, how=,left1, on=Team) return teamindex(rTeam*, inplace=False, drop二True)def get_elo(team):try:return team_elosteamexcept:#当最初没有elo时,给每个队伍最初赋base_eloteam_elosteam = base_eloreturn team_elosteam#计算每个球队的elo值def calc_elo(w
12、in_team, lose_team): winner_rank = get_elo(win_team) loser_rank = get_elo(lose_team)rank_diff = winner_rank - loser_rank exp = (rank_diff * -1) / 400odds = 1 / (1 + (10, exp)#根据rank级别修改K值if winner_rank = 2100 and winner_rank 0.5:X. append(teaml_features + team2_features)y. append(0)else:X. append (t
13、eam2_features + teaml_features)y. append (1)if skip 二二 0:print (fXf,X)skip = 1#根据这场比赛的数据更新队伍的elo值new_winner_rank, new_loser_rank = calc_elo(Wteam, Lteam) teamelosWteam = new_winner_rankteam_elosLteam = new_loser_rankreturn np.nan 一to num (X), y if _name_ = ,_main:Mstat = pd. read _csv(folder + ,/15-
14、16Miscellaneous_1)Ostat = pd. read_csv(folder + 1/15-160pponent_Per_Game_1)Tstat = pd. read_csv(folder + f/15-16Team_Per_Game_1)team_stats = initializedata(Mstat, Ostat, Tstat)result_data = pd. read_csv (folder + 1/2015-2016_r)X, y = bui1d_dataSet(resu1t_data)#训练网络模型print(Fitting on %d game samples.
15、 H % len(X)model = linear_ticRegression()(X, y)#利用10折交叉验证计算训练正确率print (HDoing cross-validation. . n)print(cross_val_score(model, X, y, cv = 10, scoring=,accuracy1, n_jobs=-l). mean()def predict_winner(team1, team 2, model): features =# team 1,客场队伍d (get_elo (teaml)for key, value in team_team 1. iter
16、items(): d (value)team 2,主场队伍d(get_elo(team_2) + 100)for key, value in team_team2. iteritems(): d (value)features = np. nan_to_num(features)return ct_proba(features)#利用训练好的model在16-17年的比赛中进行预测print(Predicting on new schedule.1) schedulel617 = pd. read csv (folder + /) result =for index, row in ows()
17、: teaml = rowf Vteam* team2 = row1Hteam1 pred = predict_winner(teaml, team2, model) prob = pred 0 0 if prob 0. 5: winner = teaml loser 二 team2 d(winner, loser, prob)else:winner = team2 loser = teaml d(winner, loser, 1 - prob)with open(f , w) as f: writer = r(f) row(1 win1, lose, probability1) rows(r
18、esult) print (f done.)try:pd. read_csv(f1, header=0) except:passimport csvwith open() as f:f_csv = r(f)headers 二 next (f_csv)for row in f_csv: print (row)课程设计题目:NBA比赛结果预测一、工程背景和目标1二、数据概览1三、数据分析2四、代码实现3五、结果及分析7参考文献8一、工程背景和目标工程背景不知道你是否朋友圈被刷屏过NBA的某场比赛进度或者结果?或者你就是一个NBA狂 热粉,比赛中的每个进球,抢断或是逆转压哨球都能让你热血沸腾。除去观
19、赏精彩的比赛过 程,我们也同样好奇比赛的结果会是如何。因此本节课程,将给同学们展示如何使用NBA比 赛的以往统计数据,判断每个球队的战斗力,及预测某场比赛中的结果。1.1 工程目标比照赛数据分析,得到代表每场比赛每支队伍状态的特征表达,利用每场比赛与胜利队 伍的关系,对2016-2017的比赛进行预测。八数据概览1.1获取NBA比赛统计数据我们将以获取Team Per Game Stats表格数据为例,展示如何获取这三项统计数据:1 .进入到Basketball中,在导航栏中选择Season并选择20152016赛季中的Summary:2 .进入到20152016年的Summary界面后,滑动
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 太原 学院 智能 自动化 课程设计 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。