hadoop 실습 기록
1. hadoop fs -mkdir /example: hadoop 환경에서 example이라는 폴더를 생성
2. hadoop fs -copyFromLocal README.txt /example: Local 위치인 /usr/local/hadoop에 있는 README.txt를 hadoop 폴더인 example에 복사
3. hadoop fs -ls /example: hadoop 폴더인 example 안의 내용물 보기
4. cd share/hadoop/mapreduce: wordcount 사용하기 위해 이동
5. hadoop jar hadoop-mapreduce-examples-3.3.0.jar wordcount /example/README.txt /output : mapreduce인 wordcount를 hadoop /example 폴더 내에 있는 README.txt에 적용시킨 후, /output이라는 폴더를 만들어 거기에 저장한다.
5번을 실행하면 위와 같이 hadoop의 /output 폴더에 _SUCCESS와 part-r-00000 폴더가 생긴 걸 볼 수 있다.
_SUCCESS는 그냥 성공했다는 뜻이고, 우리는 part-r-00000에 집중하면 된다.
wordcount 적용 끝!
여기서 끝이 아니다.
localhost:9870으로 접속한 후, 위의 Utilites > Browse the file System으로 들어간다.
그러면 위에서 생성한 두 폴더 example과 output이 있음을 볼 수 있다.
여기서 파일 확인이 가능하다.
실습
1. hadoop 환경에 /user/sesac 디렉토리 생성 후, /usr/local/hadoop/NOTICE.txt 찾아서 복사하기
hadoop fs(file system) 명령어로 리눅스 명령어처럼 사용 가능.
저 NOTICE.txt 파일은 hadoop 환경에 있는게 아니니, -copyFromLocal 옵션을 붙이자.
2. .txt 파일 찾아서 wordcount해서 ui 결과 확인
NOTICE.txt 파일이 잘 복사된 것을 볼 수 있다.
아래 명령어로 wordcount 적용시켜보자.
이제 localhost:9870으로 접속해 sesac 파일이 생성된 것을 확인해보자
실습 끝!