您的位置: 首页 > IT文章 > 暑期实训day12 暑期实训day12 分类: IT文章 • 2025-01-24 07:47:07 总结: 开发项目,通过分析日志用户画像描绘 过程: 数据清洗,第一阶段:把需要的信息从原始日志中提取出来,第二阶段:根据提取出来的信息做精细化操作 数据处理,按照我们的需要进行相应业务的统计和分析 sHive、MapReduce分布式计算框架 处理结果入库,结果可以存放到mysql 数据的可视化,通过图形化展示的方式展现出来:Echarts的饼图、柱状图 遇到的问题:清洗的数据有的不达标,最后优化了清洗算法 思维导图: