当前位置: 首页 > news >正文

hadoop3跑第一个例子wordcount

1、创建目录

hdfs dfs -mkdir -p /user/input

2、创建测试文件,并上传文件到hdfs

echo '1' > 1.txt
hdfs dfs -put 1.txt /user/input

3、进入hadoop-3目录,并创建测试文件

cd /app/hadoop-3

创建目录
mkdir wcinput
cd wcinput
保存wc.input
nano wc.input

hadoop yarn
hadoop mapreduce
spark
spark

上传文件

hdfs dfs -put wcinput/wc.input /user/input/

4、使用词频测试wordcount

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /user/input/ /user/output

问题:
如果卡住很久,修改更改mapred-site.xml文件将

<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>

改为:

<property><name>mapreduce.job.tracker</name><value>hdfs://此处为自己的电脑IP:8001</value><final>true</final></property>

再次运行即可。

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /user/input/ /user/output

5、输出统计结果

hdfs dfs -cat /user/output/*

6、修改hdfs的权限 不一定用

hdfs dfs -chmod -R 755 / 

7、常用地址
http://192.168.6.19:9870/ 查看文件
http://192.168.6.19:8088/查看mapreduce情况
8、删除输出目录

hdfs dfs -rm -R /user/output

9、如果跑例子时提示出错,找不到resource-types.xml文件,则
nano etc/hadoop/resource-types.xml
内容如下:

<configuration><property><name>yarn.resource-types</name><value>resource1, resource2</value></property><property><name>yarn.resource-types.resource1.units</name><value>G</value></property><property><name>yarn.resource-types.resource2.minimum</name><value>1</value></property><property><name>yarn.resource-types.resource2.maximum</name><value>1024</value></property>
</configuration>

10、 提示错误:Couldn’t preview the file. NetworkError: Failed to execute ‘send’ on ‘XMLHttpRequest’: Failed to load
hdfs-site.xml 增加内容,用于web预览文件

<property><name>dfs.webhdfs.enabled</name><value>true</value>
</property>

11、如果windows下需要预览文件
在C:\Windows\System32\drivers\etc\hosts
增加: 192.168.6.19 master 即可


http://www.mrgr.cn/news/27547.html

相关文章:

  • 25.<Spring博客系统②(实现JWT令牌登录接口+强制登录+获取用户信息+获取作者信息)>
  • 0 -vscode搭建python环境教程参考(windows)
  • 优化C++设计模式:用模板代替虚函数与多态机制
  • Ceph分布式存储
  • Go语言的零值可用性:优势与限制
  • 单片机智能家居火灾环境安全检测
  • สำรวจโลกที่ลึกลับของไพ่ยิปซี
  • linux命令学习-sed命令
  • 时序数据库 TDengine 的入门体验和操作记录
  • 微型导轨在光学仪器中的应用!
  • Semaphore UI --Ansible webui
  • 每日一题——第八十八题
  • Day26_0.1基础学习MATLAB学习小技巧总结(26)——数据插值
  • 机器学习课程学习周报十二
  • Unity-Transform类-缩放和看向
  • 【网络安全的神秘世界】ssrf服务端请求伪造
  • 103.WEB渗透测试-信息收集-FOFA语法(3)
  • Acwing 双链表
  • 2011年全国硕士研究生入学统一考试计算机科学与技术
  • springboot瑜伽课约课小程序-计算机毕业设计源码87936
  • ElasticSearch介绍+使用
  • 基于R语言的统计分析基础:使用键盘输入数据
  • 系统分析师--系统可靠性分析与设计
  • 「数组」堆排序 / 大根堆优化(C++)
  • 天体的结构图
  • 深入了解图像生成模型:Imagen