狐小年 2023-04-29 20:53 采纳率: 100%
浏览 205
已结题

数学建模校赛:如何治理网络暴力。只要思路就行

在人类文明不断发展向前的进程中,大数据时代应运而来。随着互联网的普及,广大网络用户获得了更方便,更广泛的表达渠道。然而不可否认的是,由于互联网的匿名性,使得网络社区也出现了无序的情绪宣泄和肆意的网络暴力(Network violence)。一场场“言语风暴”的背后,是个别人“键对键”时忽视了表达的分量、罔顾了发言的责任。要知道,匿名和虚拟不是“张口就来”的理由,道德和法治才是“言由心生”的前提。互联网并不是法外之地。2022 年初,中央网信办开展了为期 1 个月的“清朗·2022 年春节网络环境整治”专项行动,其中重点整治的五个方面任务,排在首位的就是“网络暴力、散播谣言等问题”。

表达有边界,流量有底线。如果说网络暴力行为是淹没理性、蚕食公序的洪水猛兽,那么网络平台理应成为一道守护精神家园的坚固堤坝。
近日,某社交平台在A市试点抽样统计了近一个月内匿名网民在社交平台上公开发表的言论,并对常用词条出现的次数进行统计(此数据见附件 1)。
另外,在同一个月内,该平台还对分享了地理位置的匿名网民的公开言论也以社区为单位进行了统计(此数据见附件 2)。
请根据以上数据,回答以下问题:

问题1:在社交平台上发表的言论在某些程度上能够反应一个人的价值观。物以类聚,人以群分。有相同的价值观的网民其语言的情感色彩往往有趋同性。请根据附件1中的数据,区分A市网民的价值观念群体。

问题2:我们相信世间还是正能量的人多,“键盘侠”是相对少数存在的群体。结合问题1的结果,请以合理的算法识别可能存在的“键盘侠”们,并尝试寻找“键盘侠”们与其他群体不同的词条。

问题3:每个社区由不同群体的网民组成。根据附件2中的数据,并结合问题1的结果,建立算法分析每个社区中不同群体网民的组成比例。

问题4:城市能够根据不同的功能划分为多个区域(如大学城,商业区等等),不同的功能区由附近多个小的社区组成。同一功能区的网络言论往往有一些相似性(如大学城的学生较多,所发表的言论也有相似之处)。请基于提供的数据建立算法,对A市进行较为合理的功能区划分。针对划分的结果提出治理“网络暴力”的解决方案或者建议。

数据描述
附件1:不同网民在一个月内发言的统计数据。行代表网民(netizen),共随机抽样了8449个网民。列代表词条(word),共有17681个不同的词条。数据中每一个元素代表统计得到的某一个网民发言的某个词的个数(单位是百)。
附件2:不同社区(一个社区包含多个网民)在一个月内的发言的统计数据。行代表社区(community)共统计了604个社区的发言。列代表词条(word),共有17681个不同的词条。最后一列(position)代表该社区的位置坐标(坐标是用x号隔开,例如26.96x7.97代表(26.96,7.97))。数据中每一个元素代表统计得到的某一个社区内的网民发言的某个词的个数(单位是百)。

备注:为了去除词条的敏感性,该数据不提供每一词条的具体含义。并且为了保护共享地理位置的网民隐私,附件2只测量了社区总体网民发言的次数。

  • 写回答

2条回答 默认 最新

  • 2301_76592070 2023-04-29 23:34
    关注

    (以下内容部分参考chatGPT)
    关于一些政治类的具体做法,哥们就不说了,说点咱这技术类的吧:
    问题1:根据附件1中的数据,区分A市网民的价值观念群体

    针对附件1中的数据,可以使用聚类算法将网民分成不同的群体。这里我们可以采用基于密度的DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法。该算法可以通过计算样本点在某个半径内的邻居数目,确定核心点和噪声点。通过定义邻域半径和最小邻居数,可以灵活地控制簇的数量和大小。

    具体来说,可以先对每个网民的发言进行归一化处理,然后将所有网民的数据作为样本进行聚类。通过交叉验证等方法确定最佳的邻域半径和最小邻居数,最终得到不同的群体。

    问题2:结合问题1的结果,请以合理的算法识别可能存在的“键盘侠”们,并尝试寻找“键盘侠”们与其他群体不同的词条。

    可以将问题1中得到的不同群体中,出现频率较高的特定词条筛选出来,作为“键盘侠”所常用的词汇。再使用关联规则挖掘算法(如Apriori算法)来寻找这些词条之间的关联性,进一步了解“键盘侠”的行为特征。

    问题3:基于附件2中的数据,建立算法分析每个社区中不同群体网民的组成比例

    可以采用问题1中的聚类算法对每个社区内的网民进行聚类,确定不同群体。然后根据不同群体在该社区的人数,计算出不同群体在该社区的组成比例。

    问题4:基于提供的数据建立算法,对A市进行较为合理的功能区划分。针对划分的结果提出治理“网络暴力”的解决方案或者建议。

    可以采用基于密度的DBSCAN算法或者基于层次聚类的算法,将所有社区按照相似性进行聚类,并进一步将聚类结果作为大区域进行划分,最终得到A市的功能区划分。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 5月8日
  • 已采纳回答 4月30日
  • 修改了问题 4月29日
  • 创建了问题 4月29日

悬赏问题

  • ¥15 35114 SVAC视频验签的问题
  • ¥15 impedancepy
  • ¥15 在虚拟机环境下完成以下,要求截图!
  • ¥15 求往届大挑得奖作品(ppt…)
  • ¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
  • ¥50 浦育平台scratch图形化编程
  • ¥20 求这个的原理图 只要原理图
  • ¥15 vue2项目中,如何配置环境,可以在打完包之后修改请求的服务器地址
  • ¥20 微信的店铺小程序如何修改背景图
  • ¥15 UE5.1局部变量对蓝图不可见