Data Engineering/Hadoop

[Hadoop Study] vol 1. Hadoop์ด๋ž€?

๋žญํ˜ธ(Langho) 2020. 11. 12.

 

 

 

์ถœ์ฒ˜ https://platum.kr/archives/39285

 

Hadoop

๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์‚ฐ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ž๋ฐ”๊ธฐ๋ฐ˜์˜ ์˜คํ”ˆ์†Œ์Šค ํ”„๋ ˆ์ž„์›Œํฌ

 

 

 

๋“ฑ์žฅ ๋ฐฐ๊ฒฝ

  • ๊ตฌ๊ธ€์ด ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•ด GFS(Google File System)๊ณผ MapReduce ๊ธฐ์ˆ ์„ ๊ฐœ๋ฐœํ•˜๊ณ  ๋…ผ๋ฌธ์œผ๋กœ ๋ฐœํ‘œํ–ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ณต๊ฐœํ•˜์ง€ ์•Š์Œ.
  • ๋”๊ทธ ์ปคํŒ…(Doug Cutting)์ด๋ฅผ ์—ฐ๊ตฌํ•˜์—ฌ Hadoop์„ ๊ฐœ๋ฐœํ•˜๊ณ  Apache(๋น„์˜๋ฆฌ SW ์žฌ๋‹จ)์—์„œ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ–ˆ๋‹ค.

 

 

 

์ฒ ํ•™

  • ์ผ๋ฐ˜์ ์ธ ํ”„๋กœ๊ทธ๋žจ์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ”„๋กœ๊ทธ๋žจ์ด ์žˆ๋Š” ์ปดํ“จํ„ฐ์— ๊ฐ€์ ธ์™€์„œ ์ฒ˜๋ฆฌํ•œ๋‹ค.
  • ํ•˜์ง€๋งŒ ํ•˜๋‘ก์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋Š” ์ปดํ“จํ„ฐ์— ํ”„๋กœ๊ทธ๋žจ์„ ์ „์†กํ•˜์—ฌ ์ฒ˜๋ฆฌํ•œ๋‹ค.
  • ๋ฐ์ดํ„ฐ๊ฐ€ ๋Œ€์šฉ๋Ÿ‰์ผ ๊ฒฝ์šฐ, ๋ฐ์ดํ„ฐ๋ฅผ ์˜ฎ๊ธฐ๋Š” ๊ฒƒ๋ณด๋‹ค ํ”„๋กœ๊ทธ๋žจ์„ ์˜ฎ๊ธฐ๋Š” ๊ฒƒ์ด ํšจ์œจ์ ์ด๋ผ๋Š” ๊ฐœ๋…

 

 

 

์›๋ฆฌ

  • ๊ณ ์„ฑ๋Šฅ ์ปดํ“จํ„ฐ ํ•œ๋Œ€ VS ์ ๋‹นํ•œ ์„ฑ๋Šฅ์˜ ์ปดํ“จํ„ฐ ์—ฌ๋Ÿฌ ๋Œ€๋กœ ๋ณ‘๋ ฌ์ฒ˜๋ฆฌ -> ํ•˜๋‘ก์€ ํ›„์ž
  • ๋น…๋ฐ์ดํ„ฐ๋ฅผ ์—ฌ๋Ÿฌ ๋Œ€๋กœ ๊ตฌ์„ฑ๋œ ํด๋Ÿฌ์Šคํ„ฐ์—์„œ ๋ณ‘๋ ฌ๋กœ ๋™์‹œ์— ๋ถ„์‚ฐ์ฒ˜๋ฆฌํ•˜์—ฌ ์†๋„๋ฅผ ๋†’์ด๋Š” ๊ฒƒ์ด ๋ชฉ์ 

 

์žฅ๋‹จ์ 

์žฅ์ 
  • ์˜คํ”ˆ์†Œ์Šค๋กœ ๋ผ์ด์„ ์Šค์— ๋Œ€ํ•œ ๋น„์šฉ๋ถ€๋‹ด์ด ์ ์Œ >> ๋น„์šฉ๋Œ€๋น„ ๋น ๋ฅธ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ(Open Source)
  • ์‹œ์Šคํ…œ์„ ์ค‘๋‹จํ•˜์ง€ ์•Š๊ณ , ์žฅ๋น„์˜ ์ถ”๊ฐ€๊ฐ€ ์šฉ์ด(Scale Out)
  • ์ผ๋ถ€ ์žฅ๋น„์— ์žฅ์• ๊ฐ€ ๋ฐœ์ƒํ•ด๋„ ์ „์ฒด ์‹œ์Šคํ…œ ์šด์˜์— ์˜ํ–ฅ์ด ์ ์Œ(Fault Tolerance)
  • ์˜คํ”„๋ผ์ธ ๋ฐฐ์น˜ ํ”„๋กœ์„ธ์‹ฑ์— ์ตœ์ ํ™”
๋‹จ์ 
  • HDFS์— ์ €์žฅ๋œ ๋ฐ์ดํ„ฐ ๋ณ€๊ฒฝ ๋ถˆ๊ฐ€
  • ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ๋ถ„์„์ฒ˜๋Ÿผ ์‹ ์†ํ•œ ์ž‘์—…์— ๋ถ€์ ํ•ฉ
  • ๋ฒ„์ „๋ณ„ ์—ฐ๋™ ์–ด๋ ค์›€
  • ์„ค์น˜์™€ ์„ธํŒ…์˜ ์–ด๋ ค์›€

 

 

 

๊ตฌ์„ฑ์š”์†Œ

  • HDFS(Hadoop Distributed File System) : ์—ฌ๋Ÿฌ ์„œ๋ฒ„๋ฅผ ํ•˜๋‚˜์˜ ์„œ๋ฒ„์ฒ˜๋Ÿผ ๋ฌถ์–ด์„œ ๋ฐ์ดํ„ฐ ๋ถ„์‚ฐ ์ €์žฅ ๋ชจ๋“ˆ
  • MapReduce : ๋ถ„์‚ฐ ์ €์žฅ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ๋ถ„์‚ฐ ์ฒ˜๋ฆฌ ๋ชจ๋“ˆ
  • ๊ธฐ๋Šฅ์ด ์ ์ฐจ ์ถ”๊ฐ€๋˜์–ด Hadoop EcoSystem์œผ๋กœ ํ™•์žฅ๋จ

์ถœ์ฒ˜ https://velog.io/@shinychan95/0323-2-Hadoop-Ecosystem

 

 

 

 

 

 

 

์ฐธ๊ณ  ์‚ฌ์ดํŠธ

opentutorials.org/course/2908/17055

wikidocs.net/22766

 

 

๋Œ“๊ธ€