강좌
클라우드/리눅스에 관한 강좌입니다.
자격증 분류

NCE 자격증 이론정리 60편- Analytics 분야 - 하둡(Hadoop) 요약

작성자 정보

  • 관리자 작성
  • 작성일

컨텐츠 정보

본문

Cloud Hadoop 이란?

 

-대규모 데이터를 효율적으로 분석하기 위해서는 데이터 분산관리저장소, 파일시스템, 데이터베이스, 네트워크, 데이터분석 및 시각과도구등 다양한 기술들이 필요

 

-아파치(Apache) 재단에서 관리하는 빅데이터 분산처리를 위한 대표 오픈소스 프레임워크

-여러대의 컴퓨터를 하나로 묶어 대용량 데이터를 처리하는 기술

-분산저장(HDFS) : 빅데이터 파일을 여러대의 서버에 분산 저장히기 위한 파일시스템

-분산처리(MapReduce) : 각서버에서 데이터를 분산 처리하는 분산 병렬처리를 위한 분석시스템

-오픈소스를 그대로 사용하거나, 하둡 전문 상용화 업체나 클라우드업체를 통해서 사용가능

-Hadoop의 특징

.오픈소스

  .분산저장
 

.유연한 확장성 : 수평하게  노드확장이 가능
 

 

.내결함성 : 데이터를 블록단위로 저장, 3개의 다른 노드에 복제하여 저장 특정 노드에 장애가 발생하더라도 데이터를 쉽게 복구할 수 있음.



cb2897aa7928ddcdb5688afaee5aab2e_1694579952_8844.png
cb2897aa7928ddcdb5688afaee5aab2e_1694579952_9294.png
cb2897aa7928ddcdb5688afaee5aab2e_1694579953_0255.png
 



cb2897aa7928ddcdb5688afaee5aab2e_1694579985_9805.png
 


cb2897aa7928ddcdb5688afaee5aab2e_1694580008_9289.png
 


Hadoop 기본구성 및 명령어


cb2897aa7928ddcdb5688afaee5aab2e_1694580032_2521.png
 


cb2897aa7928ddcdb5688afaee5aab2e_1694580142_2268.png
cb2897aa7928ddcdb5688afaee5aab2e_1694580142_2717.png
cb2897aa7928ddcdb5688afaee5aab2e_1694580142_3912.png
cb2897aa7928ddcdb5688afaee5aab2e_1694580142_4372.png
cb2897aa7928ddcdb5688afaee5aab2e_1694580142_4829.png
cb2897aa7928ddcdb5688afaee5aab2e_1694580142_5547.png
 

Hadoop Core 구성요소



-Hadoop Common

-HDFS

-Yarn

-MapReduce





 


관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,157 명
  • 현재 강좌수 :  36,514 개
  • 현재 접속자 :  264 명