Friday, October 14, 2016

프로젝트 우다다 - 데이터 분류기준


프로젝트 우다다의 수많은 센서데이터를 가공하기 위한 기본 스케치 입니다.

1.센싱데이터를 특정 대상물 관점의 분류기준인 criteria로 자동 구분 한다.
2.센싱데이터를 criteria에 따라 Y or N 자동 분류 하되 그 기준은 딥마인드로 자동 선택한다.
3.구분된 데이터는 또다른 deepmind 기준에 따라 dup,related,independent event로 구분
4.각각의 재조합에 대해 bootstrap aggregation으로 basement로 축약 저장한다
5.basement는 online update algorithm으로 지속 갱신
6.layered grouping은 criteria list로 구현해서 자연스레 차원을 감소시킨다

아.. 이제 뭔가 진짜같아져 ... 뛰쳐 나가서 사기나 칠까..





기본 아이디어는 집단지성에 대한 아이추판다님의 블로그를 참고했습니다.
집단지성이 성공하기 위한 수리학적인 선결조건은
서로 동일한 목적을 가지면서도 주장하는 바는 적당한 독립성이 있어야 한다.
그밥의 그나물이면 집단지성이 아니라 최적화에 실패한 짜맞춘 각본이 되어 버리고
서로의 목적이 맞지 않으면 사공이 많은 배가 되어 버리는 이유에 대한 직관적인 설명입니다.

프로젝트 우다다에서는 집단지성 까지는 필요 없습니다. 
하지만 수많은 이벤트 기록들이 서로 겹치거나 모순되는 상황에서도 미래 추세를 높은확률로 예측할 수 있어야 하고, 그러기 위해서는 충분히 독립성이 보장되도록 센서 데이터를 분류 분리 저장해야 한다는 결론을 내렸습니다.



체셔 고양이의 불확정성에 비해서는 데이터처리는 그나마 직관적인 편이죠?
확률적 알고리즘이라는 모순되는 단어를 처음 들었을 때는 거대한 사기집단을 마주한 느낌이었는데 이제 나 스스로 사기를 치고 다니네요.

남들을 보고 쉽게 사기꾼이라 판단하는 게 아닌가 봐요. 그 칼이 그대로 나에게 돌아오니...



No comments:

Post a Comment