幸福感预测方法的研究与实现


时间: 2021-08-10 14:00:48 人气: 34 评论: 0

(1)数据分析方面:数据分析,顾名思义,数据加分析。也就是说必须要以数据为先,分析为后。对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

(2)幸福感预测方面:在社会科学领域,幸福感的研究占有重要的位置。这个涉及了哲学、心理学、社会学、经济学等多方学科的话题复杂而有趣;同时与大家生活息息相关,每个人对幸福感都有自己的衡量标准。如果能发现影响幸福感的共性,生活中是不是将多一些乐趣;如果能找到影响幸福感的政策因素,便能优化资源配置来提升国民的幸福感。目前社会科学研究注重变量的可解释性和未来政策的落地,主要采用了线性回归和逻辑回归的方法,在收入、健康、职业、社交关系、休闲方式等经济人口因素;以及政府公共服务、宏观经济环境、税负等宏观因素上有了一系列的推测和发现。

2. 研究条件

课题所有内容在赛题框架下研究与实现。

3. 应用环境

(1)利用matplotlib、seaborn画图库可视化整体人群的幸福状况。

(2)利用分析工具:jupyter notebook对数据进行清洗、处理及可视化。

  (3)将分级系列值用加和的形式代替,缺省比例超过15%的数据进行删除,缺省值用众数进行代替。

(4)利用相关性矩阵找出与幸福感关联较大的数据项,利用融合CatBoostRegressor+Light

GBM+xgboost+gbdt现有模型的方式进行数据分析。

4. 工作目的

(1)数据分析目的:数据分析的目的其实就是把隐藏在大批杂乱无章的数据中进行信息的集中、萃取和提炼出来,以便找出所研究对象的内在规律。

在实用中,数据分析可帮助人们作出判断,以便采取适当行动。而且数据分析是组织、目的地进行数据收集和分析,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研、售后服务、最终处置的各个过程都是需要运用数据分析过程的,以此来提升有效性。

(2)幸福感预测目的:幸福感预测这一经典课题,希望在现有社会科学研究外有其他维度的算法尝试,结合多学科各自优势,挖掘潜在的影响因素,发现更多可解释、可理解的相关关系。在错综复杂的因素中,如何找到其中的共性,一窥幸福感的要义,进而提升人民的幸福感,能去帮助那些抑郁不开心的人,这是展开幸福感数据分析的目的。

二、参考文献

[1] 张良. 机器学习在数据挖掘中的应用分析[J]. 计算机产品与流通, 2019(2): 198-200.

[2] 陈强. 机器学习与数据挖掘[J]. 科技信息, 2018, (20).

[3] 郭皓. 机器学习算法在数据挖掘中的应用研究[J]. 数字通信世界, 2019, (3):177.

[4] 周旭. 数据挖掘中机器学习的应用[J]. 电子技术与软件工程, 2019(7).

[5] 田文英. 机器学习与数据挖掘[J]. 石家庄职业技术学院学报, 2004, 16(6):30-32.

[6] 章毅, 郭泉, 王建勇. 大数据分析的神经网络方法[J]. 工程科学与技术, 2017(1).

1. 研究内容

(1)调查人群的整体幸福感情况。

(2)对数据、缺失值、分级的数据进行处理。

(3)用模型进行分析。

2. 主要指标和技术参数

主要指标:提交结果为csv文件,其中包含id和happiness的预测值两列。

技术参数:课题使用公开数据的问卷调查结果,选取其中多组变量,包括个体变量(性别、年龄、地域、职业、健康、婚姻与政治面貌等等)、家庭变量(父母、配偶、子女、家庭资本等等)、社会态度(公平、信用、公共服务等等),来预测其对幸福感的评价。

3. 具体要求

(1)分析问题,提出分析目的。

(2)数据清洗、数据预处理及数据可视化。

(3)数据分析。

(4)建模计算。

(5)分析结果及竞赛成绩。


评论
188083800