상태이상 : 호기심 중독

이것저것 알아두면 언젠간 도움이 된다.

IT시작!/IT용어

다크 데이터

IT코코아 2018. 11. 28. 06:00

다크 데이터

: 정보를 모은 후 사용되지 않고 저장되어 있는 데이터들의 집합.

SNS를 하다가 알게된 처음보는 단어라 한 번 검색해서 저 나름대로 정리해 서술해 볼려고 합니다.

요즘 빅데이터 기술의 활용을 위해 많은 엄청난 데이터들을 모으는데 모은 데이터들이 모두 사용되는 것은 아닙니다. 그렇기 때문에 저장공간만 차지하여 기업의 입장에서는 비용을 낭비할 수 있습니다.

개인의 입장에서 생각해보면 배경화면을 다운 받을 때 맘에 드는 이미지를 여러개 다운받고 나서 몇가지만 사용하고 나머진 '나중에 바꿀 때 써야지' 하면서 방치해 두는 경우에도 이 이미지 자료들은 다크 데이터가 되어 버리는 것이라고 할 수 있습니다.

다시 기업의 입장으로 생각해 봅시다.
빅데이터 기술을 활용하기 위해 모았던 수 많은 데이터들 중 왜 활용되지 못하는 다크 데이터가 생겨날까요??
그 만큼 수요가 없는 데이터이기 때문입니다.
이미지 사용만 해도 자연 사진, 게임 캐릭터 사진등은 사람들이 많이 찾고 사용하지만 집 도면, 회로판 같은 사진들은 상대적으로 수요가 없는 것 처럼 데이터들도 이와 같다는 것 입니다.


그렇다고 다크 데이터들을 모두 지워야 하는 것 일까요?

제가 생각하기엔 전부 지우는 것보다는 다크 데이터도 데이터라는 점에서 '나중에 사용할 수 있는 자료' 이기 때문에 남겨 놓을 것 같습니다. 점점 하드디스크의 저장 용량도 늘어나고 있고 하니깐 괜찮을 것 같달까?

그리고 이 다크 데이터의 유형을 분석하여 '나중에 사용할 데이터'를 '지금 사용할 데이터'로 활용하기 위해 활용할 방법을 곰곰히 생각해 사용하면 기업의 입장에서도 도움이 될 것이라 생각합니다.

반응형

'IT시작! > IT용어' 카테고리의 다른 글

파일 시그니처(File Signature)  (0) 2020.01.06
메타데이터(MetaData)  (0) 2018.11.30
여러가지 인터페이스의 종류  (0) 2018.11.26
DHCP  (0) 2018.09.18
라이브러리  (0) 2018.01.09