ref01_지식표현 및 추론_정보이론

지식 표현 및 추론

0. 용어 정리

0.1 정보이론

  • 기능 : 정보량을 수치화 하고 그것의 연산을 가능하게 함
    • 정보량 : 새로운, 놀라운 정도
    • 확률과 정보량은 반비례 한다. = 확률이 적을수록 정보량은 크다(새롭고,놀랍다)
    • eg: 오늘평화롭다. 내일도 평화롭다 Vs. 오늘평화롭다. 내일 전쟁이 난다.

0.2 Entropy

  • 랜덤 변수 x가 가질수 있는 모든값(사건)에 대해 정보랼을 평균화 한것
  • 정보량, 정보를 전달하기 위한 평균 bit 갯수
  • Bit의 expected value =

A. Conditional Entropy

x의 값이 정해 졌을때 y를 전달하기 위해 필요한 bit 갯수의 평균

B. 상대 엔트로피(=KL 다이버전스)

1. 지식 표현

1.1 정의

  • 경험이나 교육을 통해 얻어진 전문적인 이해(understanding)와 체계화된 문제 해결 능력
  • 어떤 주제나 분야에 대한 이론적 또는 실제적인 이해,

    또는 현재 알려진 사실과 정보의 모음

1.2 분류

  • 암묵지(暗黙知, tacit knowledge) : 형식을 갖추어 표현하기 어려운, 학습과 경험을 통해 쌓은 지식
  • 형식지(形式知, explicit knowledge) : 비교적 쉽게 형식을 갖추어 표현될 수 있는 지식

1.3 종류

  • 절차적 지식(procedural knowledge) : 문제해결의 절차 기술
  • 선언적 지식(declarative knowledge) : 어떤 대상의 성질, 특성이나 관계 서술

2. 규칙

  • 지식 표현 방법 중 하나
  • 조건부의 지식을 표현하는 if-then형태
  • 직관적, 이해하기 쉬움
  • eg. 신호등이 녹색일때는 건널목을 건너도 된다.

3. 프레임

  • 지식 표현 방법 중 하나
  • 민스키(M. Minsky, 1927~2016)가 제안한 지식표현 방법
  • 특정 객체 또는 개념에 대한 전형적인 지식을 슬롯(slot)의 집합으로 표현하는 것

4. 논리

  • 지식 표현 방법 중 하나
  • 말로 표현된 문장들에 대한 타당한 추론을 위해, 기호를 사용하여 문장들을 표현하고 기호의 조작을 통해 문장들의 참 또는 거짓을 판정하는 분야

4.1 명제(Propositional logic) 논리

정의 : 참, 거짓을 분명하게 판정할 수 있는 문장

방법

  • 명제를 P, Q등과 같은 기호로 표현
  • 명제 기호의 진리값(truth value)을 사용하여 명제들에 의해 표현되는 문장들의 진리값 결정

eg.

  • 알렉산더는 아시아를 넘본다 : P
  • 징기스칸은 유럽을 넘본다 : Q
  • 알렉산더는 아시아를 넘보고, 징기스칸은 유럽을 넘본다 : P ∧ Q

4.1 술어(predicate logic) 논리

정의

  • 명제의 내용을 다루기 위해 변수, 함수 등을 도입하고 이들의 값에 따라 참, 거짓이 결정되도록 명제 논리를 확장한 논리

방법

  • 문장의 ‘주어+서술어’형태에서 서술어에 해당
  • 대상의 속성이나 대상 간의 관계를 기술하는 기호
  • 참(T) 또는 거짓(F) 값을 갖는 함수
  • 존재 한정사(existential quantifier) 와 전칭 한정사(universal quantifier) 사용

e.g.

  • Student(John)
  • Friend(John, Mary)
  • Father(Adam,x)

5. 의미망(Semantic network)

정의

  • 지식을 이항 관계(binary relation)의 집합으로 표현
  • 노드와 방향성 간선으로 구성되는 그래프를 사용해 지식 표현

eg.

의미망에서 사용되는 관계

  • is-a
  • has-a

의미망의 추론 : 주어진 지식으로부터 새로운 사실을 이끌어내는 추론도 가능

  • 주어진 사실: 철수가 영희에게 반지를 주었다
  • 추론 결과 : 영희가 반지를 가지고 있다

6. 스크립트

정의

  • 일반적으로 발생할 수 있는 전형적인 상황에 대한 절차적 지식을 일목요연하게 표현
  • 전형적인 상황에서 일어나는 일련의 사건(event)을 시간적 순서를 고려하여 기술하는 프레임과 같은 구조의 지식 표현

7. 온톨로지와 RDF

정의

  • 철학에서 존재론(存在論)을 가리키는 말
  • 어떤 영역의 지식을 공유하고 재사용할 수 있도록 해당 영역의 개념과 관계를 나타내는 어휘를 정의하고 이를 이용해 지식을 표현해 놓은 것
  • 영역(domain)에 있는 개념, 개념에 대한 특성 및 속성, 이들 특성과 속성에 대한 제약조건, 영역에 있는 일부 개체에 대한 정보가 기술(記述)
  • 의미망과 비슷하게 방향성이 있는 그래프로 표현 가능

특징

  • 영역에 대한 공통된 어휘(vocabulary) 사용
  • 영역에 대한 공통된 이해 지원
  • 서로 간 토의를 통해 합의를 이룬 것을 표현
  • 컴퓨터에서 다룰 수 있는 형태로 정형화하여 표현

사례

  • UNSPSC(United Nations Standard Products and Services Code): 제품 및 서비스 용어
  • WordNet(wordnet.princeton.edu): 영어 단어의 어휘목록과 어휘목록 사이의 다양한 의미 관계를 기록
  • UMLS(Unified Medical Language System): 의료영역의 여러 용어체계를 총괄

8. 불확실한 지식 표현

8.1 불확실성의 원인

A. 약한 관련성의 지식

약한 인과성(weak implication)이나 애매한 연관관계(vague association)인 지식의 표현

  • 확신도(certainty degree) 사용 표현
  • 베이즈 정리(Bayesian theorem) 사용 표현

B. 부정확한 언어 사용

자연어(natural language)는 본질적으로 모호하고(vague) 부정확(imprecise)

  • 퍼지이론(fuzzy theory) 사용 표현

C. 불완전하거나(incomplete) 결손된(missing) 데이터에 기반한 지식

  • ‘알려지지 않은 것(unknown)’으로 간주하고, 근사적인 추론(approximate reasoning) 진행

D. 상충되는 지식의 통합

모순된 견해(contradictory opinion)와 상충된 지식(conflicting knowledge)의 통합

  • 지식 소스 별로 가중치 부여

8.2 불확실성을 표현/다룰수 있는 방법

A. 확신도 (certainty factor)

규칙(rule)과 사실(fact)의 신뢰정도를 [-1,1] 구간의 값으로 표현 eg. 1 (단정적 신뢰), -1 (단정적 불신)

B. 확률

베이즈 정리 (Bayesian theorem)

C. 퍼지 이론

퍼지집합(Fuzzy Set)

  • 원소가 모임(collection)에 어느 정도 속한다는 것
  • 명제는 참 또는 거짓이 아니라 어느 정도는 부분적으로 참(이거나 부분적으로 거짓)
  • 소속정도(membership degree)는 [0,1] 범위의 실수값으로 표현

키가 크다 작다가 아니라 0.7크다에 속하다로 표

9. 확률 그래프 모델

9.1 확률 분포에 의한 지식 표현

확률 이론과 그래프 이론을 결합하여 확률분포(probability distribution)를 표현하고, 관심있는 대상(확률변수)에 대한 확률을 계산할 수 있는 모델

확률 분포를 이용하여 지식 표현, 효과적으로 표현하기 위해 그래프 모델

e.g. 절도 경보 문제

가정

  • 절도가 발생하거나 지진이 발생하면 경보 발생
  • 경보가 울리면 이웃이 전화

불확실한 요소가 있어 확률로 표현: 확률변수(random variable)

  • 경보 작동(A; alarm)
  • 절도 발생(B; burglary)
  • 지진 발생(E; earthquake)
  • 이웃 전화(N; neighbor call)

Step 1. 결합확률 분포로 표현

경보가 울릴 때 이웃이 전화할 확률은? P(N=T|A=T)

이웃이 전화 했을 때 도둑이 들었을 확률은 ? P(B=T|N=T)

확률 분포표는 데이터 수집등을 통해 생성했다고 가정

Step 2. 조건부 독립을 이용한 확률분포의 인수 분해

[참고]확률분포의 인수분해
P(A,B) = P(A\ B)P(B) P(A,B,C) = P(A\ B,C)P(B\ C)

원식을 인수 분해

  • P(N,A,E,B) = P(N|A,E,B)P(A|E,B)P(B)

가정 및 독립성질 축약

  • P(N|A,E,B) = P(N|A)로 축약 가능
    • 절도가 발생하거나 지진이 발생하면 경보 발생
  • P(E|B) = P(E)로 축약 가능
    • 상관 없음

Step 3. 최종식(결합확률분포) 도출

최종 식 : P(N|A)P(A|E,B)P(E)P(B)

Step 4. 문제 적용

예) P(N=T, A=T, E=F, B=T) = P(N,A,E,B) = P(N|A)P(A|E,B)P(E)P(B) = P(N=T|A=T)P(A=T|E=F,B=T)P(E=F)P(B=T) = 0.8 0.9 0.9 * 0.3 = 0.1944

9.2 베이지언 네트워크

조건부 확률의 곱으로 표현된 확률분포(=결합확률 분포)를 방향성이 있은 그래프로 표현

  • 노드 : 확률 변수
  • 에지 : 의존 관계

이웃집이 전화(N)는 알람(A)에 의해서 발생하고, 알람(A)는 지진(E)이나, 도둑(B)에 의해서 발생

9.3 마르코프 네트워크

  • 확률 분포를 방향성이 없는 그래프를 사용하여 표현
  • 마르코프 랜덤필드(Markov random field)라고도 함
  • 확률분포를 요소함수(factor)들의 곱으로 표현

10. 함수 기반 지식 표현

기호 대신 수치값과 수치값을 계산하는 함수를 사용하여 지식을 표현,

  • 회귀분석(regression analysis)
  • 신경망(neural network)
  • SVM(support vector machine)
  • 딥러닝(deep learning)

다음장에서 중심적으로 다룰 예정

11. 규칙기반 시스템 (rule-based system)

  • 지식을 규칙의 형태로 표현
  • 주어진 문제 상황에 적용될 수 있는 규칙들을 사용하여 문제에 대한 해를 찾도록 하는 지식 기반 시스템(knowledge-based system)
  • 전문가 시스템(expert system)을 구현하는 전형적인 형태

results matching ""

    No results matching ""