请选择 进入手机版 | 继续访问电脑版

车友会论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 286|回复: 2

为什么高考作文题目是可预测的?(转)

[复制链接]

0

主题

7235

帖子

3294

积分

游客

积分
3294
发表于 2014-6-5 08:07:29 | 显示全部楼层

为什么高考作文题目是可预测的?(转)

来源:http://www.geekonomics10000.com/815
为什么高考作文题目是可预测的?

同人于野


(百度知道,2014年6月2日)

很多中学老师认为高考题目是可以预测的,他们声称自己能感觉到出题的趋势,并且在考前帮着学生押题。我上学的时候总觉得押题是个不靠谱的事,难道出题的人没有自由意志吗?事实是,我们都没有自由意志。

百度最近出了个新东西,“百度预测”,目前提供针对世界杯、城市、景点和高考四大项目的预测。尤其在高考方面,百度通过数据分析认为[1]2014年高考作文题目将会出现在“时间的馈赠”、“生命的多彩”等六个领域之中,并且给出了各领域命中的精确概率。直接告诉你高考作文题是什么当然不可能,但是有了这个范围,学生们需要准备的话题就从无限多变成有限多了。百度说这个预测是“基于海量作文范文和搜索数据”。各领域下列举的作文题目关键词,比如“时间的馈赠”中的关键词包括“记忆”、“未来”、“成长”、“忘记”等,都是中学生作文的常用词。

也就是说,百度用数据分析预测出来的高考作文题,都是最常见的作文题,都是俗套。换句话说,用数据分析搞预测的隐含假设是未来事件会继续落入最近流行的俗套。

可是出题的人有必要尊重俗套吗?难道出《让未来记住今天》或者《守住心灵的那扇门》这种俗不可耐的题目不是可耻的吗?在回答这个问题之前我们先研究一个更大的问题:到底什么样的东西是可预测的,什么样的东西是不可预测的。

最近几年美国出了一位预测牛人,Nate Silver。美国人很喜欢体育数据,有些棒球杂志上更是连篇累牍全是各种细致的数据。Silver基于统计模型,自己搞了个软件来通过分析职业棒球的数据去预测各个球员未来的表现。结果他的预测结果超越了所有最有经验的球探。不但如此,他的政治预测成绩更令人瞠目结舌。2008年大选,对各州总统选举结果,50个州Silver预测对了49个;对35个参议员席位,Silver全部命中。更关键的是,他的预测跟政治专家的预测相差极大 — 事实证明听专家的远远不如听数据分析的。Silver 2012年出了本书,The Signal and the Noise(中译本《信号与噪声》),谈预测的学问。

Silver在书里说,你别看我预测水平高,其实我预测的东西是容易预测的。比如说棒球,我们都知道这个比赛相当沉闷外行看着感觉一点都不热闹。棒球的特点恰恰是运动员具有相当的独立性。一个球员的水平是什么样就是什么样,他对球队的贡献非常稳定,并不怎么依赖队友的发挥和对手的表现,场上的随机因素也比较少。相对而言足球就不是这样,一个球员水平再高也得依赖队友、教练和对手,甚至包括裁判,有时候一着不慎满盘皆输。

关键在于,像棒球这样的简单系统,里面没有连锁反应。我们都听过一个笑话说拿破仑之所以在滑铁卢战败是因为他穿了紧身裤。紧身裤导致拿破仑得了痔疮。痔疮导致他在战斗的关键时刻未能居中指挥……这就是连锁反应。连锁反应通常是正反馈的过程,每一环带来的破坏都可能比上一环更大,而且都可能直接激发下一环。对预测者来说更麻烦的是这种反应充满偶然,大多数情况下反应不了几环就会终止,有时候却可能导致大麻烦。

简单的系统容易预测,因为一个个体哪怕出点预测范围以外的波动,对整个系统也不会有大影响。而如果一个系统中包含各种正反馈机制,它就是不好预测的复杂系统,一个个体的小波动就有可能通过连锁反应层层放大出现蝴蝶效应。比如现代金融体制就是一个复杂系统。地产下跌可能会导致人们还不起房贷,房贷还不上会导致银行受不了,银行一收紧信贷其它行业又受不了,最后可能就是大规模的金融危机。Silver说,那些信用评级机构,给这个评个AAA,给那个评个AA+,这些所谓评级都是根据市场“正常”情况下的数据分析而来,可是一旦发生连锁反应,市场就不正常了,你的那些数据就根本没用!复杂系统,是可能出“黑天鹅”的系统。

“黑天鹅”这个比喻的发明人 Nassim Nicholas Taleb 有个思想很有意思[2]。他说自然本来就是个复杂系统,它的本性其实是充满波动的,时不时就会出点事 — 可是现代化的政府机构却总是谋求让社会能够稳定地运行。Taleb认为时不时出点小事其实是可以锻炼人的;你如果一味追求人为的稳定,最后反而可能会让整个系统变得脆弱,一旦维持不了稳定就会出大事。

我们不管Taleb后面一句话对不对,单论“政府机构谋求稳定”这一点,那是绝对没错。

那么高考是个简单系统还是复杂系统?当然是简单系统!搞预测的人最怕黑天鹅,高考出题者更怕黑天鹅。高考的任务并不是探索先进文化,而是给大学招生。这个任务甚至不是给最好的大学招天才学生,而是给全国所有大学招各种水平的学生。每个考区只有一套试题,不管你报考的是北京大学中文系还是三峡大学科技学院,你都要面对同样的作文题。

在这种情况下出题者必须让所有人都能有所发挥。他们不会让你谈对乌克兰局势的看法,也不会像法国高考那样让你分析笛卡尔著作[3],否则对那些只想上个普通大学将来谋个普通工作的学生是不公平的。学生水平不一之外,还必须考虑各地文化氛围也不一样,边远地区的孩子可能跟本没看过美剧,这种情况下出题可以涉及《非诚勿扰》,而绝不可能涉及《24小时》。我国古代科举考试出题范围只限于四书五经,也是这个道理。

不能考太深,不能考太广,出题者还剩下多少选择?在出题者和考生之间只有单向关系,出题者不需要什么反馈,更不需要正反馈!他们要确保那些稍微聪明一点用功一点的孩子都能考上,把偶然因素降到最低。他们最不想看到的就是一道标新立异的作文题激发社会的强烈反响,他们决不允许任何事故。他们完全不指望用高考题促进社会进步,也不打算通过出题让自己青史留名。他们的使命就是给不确定的世界增加一点确定性。

所以他们必然诉诸俗套。俗套最安全。数据分析指向哪里,他们就打向哪里。

那么面对一道俗套的作文题,你应该怎么写作文呢?答案是写俗套的作文。高考不是施展写作才华的地方,你有才华阅卷人也看不出来。事实上何止是高考,就连美国中学的英文课老师,也看不出来真正的好作品。列纳德·蒙洛迪诺是一位非常著名的科普作家,他跟霍金合写了《时间简史》和《大设计》。蒙洛迪诺有一次替自己十五岁的儿子写了一篇作文,交上去结果只得了A-[4]。他震惊之余问了另一位作家朋友,那人经常在纽约时报之类的地方发表文章,给女儿写作文却只得了个B。

你知道阅卷老师读完一份作文并且给出评分总共用长时间吗?十分钟?五分钟?两分钟?答案是新手50秒,老手34秒[5]!在这么短的时间内没人会品评你的美句,没人会研究你的新思想,你真写一篇惊世骇俗的策论出来最大可能性是阅卷者没看懂直接给个低分。在这个机械化的业务中谁也别指望出奇制胜 — 除非你古文写得好,那可能另当别论,古文的确一眼就能被看出来,也许老师们会乐于在枯燥的阅卷工作中拿你的文章消遣一下。如果你热爱写作可以没事在网上写写,高考作文是个拿点经验值赶紧走人的项目。

所以如果百度能掌握到像职业棒球那样全面的数据,它就不但能预测作文题,还能根据题目和平时习作成绩预测每个学生的作文得分!

如果你觉得这种作文考试非常可悲,我要说的就是现实比这个还可悲。在高考中出题人的追求是“好使”,而受众则大多是俗人,双方都没有什么创新的需求。还有什么项目也是这种局面呢?

比如说娱乐业。超人蜘蛛人蝙蝠侠钢铁侠,好莱坞为什么翻来覆去总拍这些老超级英雄的故事?难道不应该经常推陈出新吗?因为这些人物的故事好使。这是一项完全成熟的业务,观众知道自己花钱买票能得到什么,好莱坞也知道这么拍一定会获得稳定的回报。观众和电影制作者达成默契,谁也不用担心谁。一个电影的投资规模越大,它的剧情就越俗套,大制作常常甚至干脆重拍一个所有人都知道的故事,因为大投入要求更小的风险。

俗套好使!所以越流行的东西常常越俗套,这就是为什么真正的文艺青年都以不爱流行文化为荣。汪峰能泡章子怡肯定够酷吧?可是有人统计了汪峰在大陆发行的9张专辑共117首歌曲的歌词[6],发现其用词大量重复:“爱”出现54次,“生命”出现50次,“碎”和“路”各37次,“哭”35次,“孤独”34次。从他有限的词汇表里随便选几个词就能组合成一句汪峰风格的歌词,比如“不再迷惘的生命,被燃碎了千万次,也依然坚强。”谁说数据分析不能创作艺术?

汪峰人称“浪子”— 这个词的字面涵义似乎就是行为不可预测,但事实证明汪峰老师除了感情生活经常给人惊喜,其他方面还是很好预测的。
回复

使用道具 举报

1

主题

2万

帖子

2万

积分

论坛元老

Rank: 8Rank: 8

积分
20423
发表于 2014-6-5 08:29:20 | 显示全部楼层
看了一下,二维坐标右下角(热门易考)海口经济学院、三亚学院赫然在列。
回复

使用道具 举报

0

主题

7235

帖子

3294

积分

游客

积分
3294
 楼主| 发表于 2014-8-11 08:42:15 | 显示全部楼层
来源:http://www.geekonomics10000.com/826
[B]主题锤子和素材钉子的军备竞赛[/B]
同人于野


(百度知道)

百度使用数据分析对2014高考作文题目预测这件事,值得再写篇文章。这是一次相当成功的预测,据有人分析,预测“命中了全国18卷中12卷作文方向”。其实在我看来还不止如此,甚至可以说全中。不过这些都不重要,甚至高考也不重要。重要的是,大数据的这种玩法,会给世界带来什么改变。


锤子和钉子

中国高考作文的出题方法有个固定的套路:给你讲一段小故事,然后让你根据这个故事,想想自己受到什么启发,写篇文章。换句话说你的作文重点根本不是这个故事,故事只是你要写的主题的一个素材。

同一个素材,各人思考角度不同,可以对应不同的主题。但更重要的是,不同的素材可以对应同样的主题。

比如全国卷的一个题目是“不要给野生动物喂食,否则它会丧失自己的觅食能力”。出题者的意图显然不是让人写一篇关于野生动物喂养的科普文章。

一个角度是把自己想象成野生动物,主题是年轻人应该自己闯荡,不能依赖前人经验的灌输。这不就是百度预测“生命的多彩”中的“奋斗”、“自由”和“青春”吗?而使用同样的主题,只要把文章稍加修改,完全还可以对付上海市的作文题:“你可以选择穿越沙漠的道路和方式,所以你是自由的;你必须穿越这片沙漠,所以你又是不自由的。”

另一个角度则是把自己想象成面对野生动物的人,那么主题就是要尊重自然,保护环境。这不就是百度预测“发展的困惑”中的“自然”、“环境”和“尊敬”吗?同样的主题下把文章稍加修改又可以对付辽宁省的作文题:“可惜漫天繁星没有了,沧海桑田转眼之间啊!当年那些祖先山洞边点燃篝火,看月亮初升天汉灿烂,他们欣赏的也许才是美景。”

现在我们的关键问题来了。到底是主题多呢,还是素材多?答案当然是素材多。素材怎么编都可以,但全体高中生都能想明白和说明白的道理就那么几个 — 具体说来,据百度数据分析发现,只有六个方面而已。

只要一个人熟读这六个方面各种可能主题的文章,掌握其写作套路,不管高考出什么素材都能应对自如。

这就正如有句谚语说“如果你手里有一把锤子,你看什么东西都是钉子”。这句谚语本来是贬义的,意思是告诫人们不要把什么东西都往自己掌握的有限理论上套。比如近年来人们学会了进化心理学之后,就不管看到什么社会现象都想用进化心理学解释,以至于我现在一听进化心理学就浑身起鸡皮疙瘩。

可是如果把这个锤子精神用在准备考试上,那是最好不过了 — 只不过你需要掌握的不是一把,而是六把锤子 — 有了这六把锤子就可以对付几乎所有的高考钉子。其实锤子精神还可以用在领导讲话上,任何事情都必须“高举中国特色社会主义伟大旗帜,以邓小平理论、“三个代表”重要思想为指导,深入贯彻落实科学发展观……”这方面目前一共有三把常用锤子,它们总是同时出现。

那么百度发现这些锤子用的是什么技术呢?


主题模型

给你一篇文章,你怎么能看出来这篇文章是说什么的呢?具体说来,你怎么能让机器知道这篇文章是说什么的呢?这个思想叫做“主题模型(topic modeling)”。

百度作文预测使用的主题模型技术叫做“隐含狄利克雷分布(Latent Dirichlet allocation,LDA)”。这是一个2003年才被提出的新技术,它的发明人之一正是刚刚加入百度,负责“百度大脑”项目的吴恩达。

LDA的基本思想非常简单。计算机认为文章只不过是一些词汇的集合。而每个主题,也只是一些关键词的集合。计算机没必要“理解”每个主题或者每个词的意思,甚至根本不用管这些词出现的先后顺序。

我们人为地设定一些主题,并且在数据分析的帮助下给每个主题设定好关键词。比如“狗”的主题下的关键词可以包括“骨头”、“汪星人”、“忠诚”、“朋友”等等,如果是最近的研究恐怕还要加上“广西玉林”。这些关键词的设定没必要非常严格,到底哪个词更重要可以交给机器去发现。

这样我们就有了一个主题的集合,每个主题又都是一大堆关键词的集合。同样一个词可以在多个主题中出现,但是在不同主题下出现的概率是不同的。

计算机要做的仅仅是使用一定的数学方法对根据每篇文章中的词汇进行分析。一篇文章拿过来,你要做的就是把事先设定的所有主题一个一个的过一遍,计算这篇文章中的词汇对应每个主题的可能性是多少。计算结果,就是这篇文章说的是每个主题的概率大小。一篇文章也许可以有超过一个主题,这不是问题。关键在于,计算机可以判断一篇文章最有可能说的是什么主题,第二可能说的是什么主题……这就相当于计算机已经“读懂”了这篇文章。

百度只要把海量的作文都用这种方法分析一遍,就得到了各种不同主题的出现总概率。更进一步,再结合年度风云搜索信息和当年的热点新闻信息,就可以判断现在最流行的作文主题是什么了。

LDA有很多应用。只要把“文章”改成“图像”,把“主题”改成“物体”,它就可以用来分析一张图片中都有什么物体,并用于给图像分类。它还可以用来分析音乐的乐句,再结合每首歌的受喜爱程度,就可以用于歌曲推荐。我猜主题模型的方法还可以用于分析新闻报道、电影剧本、小说和游戏情节,这样机器就能比任何文化批评家更早意识到现在流行什么。

如果机器如此厉害,人又当如何呢?


未来

设想几年之后,所有考生都知道了百度能预测作文题。这些考生将会熟练掌握百度指出的任何主题。这样一来,他们的高考作文成绩将会非常接近 — 而这是出题者所不愿意看到的,因为高考的作用不是为了证明学生学得好,而是为了选拔,选拔要求必须有比分差距。

出题者怎么办?他们必须打破俗套,发明全新主题!从这个意义上讲数据分析带来了社会进步。

但这有一个问题。数据分析会迅速发现这个新主题,并且促使它以比以往快得多的速度流行开来。等到所有考生都掌握了新的主题,这个新主题就又没用了。

所以数据分析的真正作用是能让好东西迅速流传开来……然后迅速消亡。这里说的当然不只是高考作文,更重要的是电影剧情之类。

华尔街的金融公司使用各种数学模型进行股票交易。这些模型的特点是一开始如果只有你在用,你也许可以非常赚钱,可是一旦别人也开始用同样的模型,那么市场就会在这方面变得越来越有效率,以至于这个模型的回报率就越来越低。于是你就只能再去发明一个新模型,一个更复杂的模型。直到这个模型也变得不好使。

结果华尔街就永远需要新模型,而且越来越复杂,越来越不容易赚钱。这是一场军备竞赛。

主题也是如此。一个好使的主题会因为有太多人使用而变得不再好使,人们被迫发明新主题,但新主题也将会变得不好使。

这都是互联网和数据分析带来的。整个过程的节奏可能会越来越快。历史必然加速前进,直到……
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天涯自驾车友会 ( 琼ICP备05005327号 )

GMT+8, 2018-10-17 07:29 , Processed in 0.044919 second(s), 15 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表