다크 데이터
: 정보를 모은 후 사용되지 않고 저장되어 있는 데이터들의 집합.
SNS를 하다가 알게된 처음보는 단어라 한 번 검색해서 저 나름대로 정리해 서술해 볼려고 합니다.
요즘 빅데이터 기술의 활용을 위해 많은 엄청난 데이터들을 모으는데 모은 데이터들이 모두 사용되는 것은 아닙니다. 그렇기 때문에 저장공간만 차지하여 기업의 입장에서는 비용을 낭비할 수 있습니다.
개인의 입장에서 생각해보면 배경화면을 다운 받을 때 맘에 드는 이미지를 여러개 다운받고 나서 몇가지만 사용하고 나머진 '나중에 바꿀 때 써야지' 하면서 방치해 두는 경우에도 이 이미지 자료들은 다크 데이터가 되어 버리는 것이라고 할 수 있습니다.
다시 기업의 입장으로 생각해 봅시다.
빅데이터 기술을 활용하기 위해 모았던 수 많은 데이터들 중 왜 활용되지 못하는 다크 데이터가 생겨날까요??
그 만큼 수요가 없는 데이터이기 때문입니다.
이미지 사용만 해도 자연 사진, 게임 캐릭터 사진등은 사람들이 많이 찾고 사용하지만 집 도면, 회로판 같은 사진들은 상대적으로 수요가 없는 것 처럼 데이터들도 이와 같다는 것 입니다.
그렇다고 다크 데이터들을 모두 지워야 하는 것 일까요?
제가 생각하기엔 전부 지우는 것보다는 다크 데이터도 데이터라는 점에서 '나중에 사용할 수 있는 자료' 이기 때문에 남겨 놓을 것 같습니다. 점점 하드디스크의 저장 용량도 늘어나고 있고 하니깐 괜찮을 것 같달까?
그리고 이 다크 데이터의 유형을 분석하여 '나중에 사용할 데이터'를 '지금 사용할 데이터'로 활용하기 위해 활용할 방법을 곰곰히 생각해 사용하면 기업의 입장에서도 도움이 될 것이라 생각합니다.
'IT시작! > IT용어' 카테고리의 다른 글
파일 시그니처(File Signature) (0) | 2020.01.06 |
---|---|
메타데이터(MetaData) (0) | 2018.11.30 |
여러가지 인터페이스의 종류 (0) | 2018.11.26 |
DHCP (0) | 2018.09.18 |
라이브러리 (0) | 2018.01.09 |