博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
mapreduce 处理气象数据集
阅读量:6891 次
发布时间:2019-06-27

本文共 1067 字,大约阅读时间需要 3 分钟。

cd /usr/hadoopsodu mkdir qxcd /usr/hadoop/qxwget -D --accept-regex=REGEX -P data -r -c ftp://ftp.ncdc.noaa.gov/pub/data/noaa/2017/1*cd /usr/hadoop/qx/data/ftp.ncdc.noaa.gov/pub/data/noaa/2017sudo zcat 1*.gz >qxdata.txtcd /usr/hadoop/qx#!/usr/bin/env pythonimport sysfor i in sys.stdin:     i = i.strip()     d = i[15:23]     t = i[87:92]     print '%s\t%s' % (d,t) #!/usr/bin/env pythonfrom operator import itemggetterimport syscurrent_word = Nonecurrent_count = 0word = Nonefor i in sys.stdin:     i = i.strip()     word,count = i.split('\t', 1)     try:          count = int(count)     except ValueError:          continue     if current_word == word:         if current_count > count:              current_count = count     else:         if current_word:             print '%s\t%s' % (current_word, current_count)         current_count = count         current_word = wordif current_word == word:     print '%s\t%s' % (current_word, current_count)chmod a+x /usr/hadoop/qx/mapper.pychmod a+x /usr/hadoop/qx/reducer.py

 

转载于:https://www.cnblogs.com/lk666/p/9016884.html

你可能感兴趣的文章
Docker 获取容器镜像报错
查看>>
20145328 《Java程序设计》第9周学习总结
查看>>
MySQL-5.5.23 在Windows上的安装及使用( MySQL简明教程)
查看>>
eclipse中没有server选项无法配置Tomcat
查看>>
awakeFromNib和viewDidLoad的区别(转)
查看>>
yum提示Another app is currently holding the yum lock
查看>>
Jackson
查看>>
我的友情链接
查看>>
equals方法中变量在前和在后的区别
查看>>
setToolTipText自动换行 .
查看>>
我的友情链接
查看>>
我的友情链接
查看>>
深入JAVA序列化反序列化
查看>>
Apache Spark源码走读之22 -- 浅谈mllib中线性回归的算法实现
查看>>
compute post expression
查看>>
C#中DataTable中的Compute方法使用收集
查看>>
杭电 Problem 4548 美素数【打表】
查看>>
Netty引导流程解读
查看>>
Spring boot 默认静态资源路径与手动配置访问路径的方法
查看>>
Spring Boot☞ 配置文件详解:自定义属性、随机数、多环境配置等
查看>>