Concepts

BASICS OF PREDICTIONIO

PredictionIO Server의 역할

Data 수집
예측결과 REST API 제공

PredictionIO Server의 구성

App
- Server 안에 App은 database 의 DB 혹은 Collection이다. (ex: orcle -> table space, mysql -> DB, mongoDB -> DB…..)
- 관계 데이터(Relevant Data), 사용자 행동등의 데이터는 App에 수집된다.
- App은 하나 또는 여러개의** 예측 엔진(prediction engine)을 포함**한다.
- App Data는 엔진들 사이에서 공유된다.
Engine
- 하나의 엔진은 반드시 prediction type (or engine type), 에 속해야 한다. (type = Item Recommendation Item Similarity 내장 타입)
- 각 엔진은 데이터를 처리하고, 각 엔진별 독립적으로 예측 모델(predictive model)을 구성한다.
- 따라서, 모든 엔진은 자신의 예측 결과 셋을 제공한다.
  - 예를 들어, App 안에 두개의 engine을 만들고, 하나의 엔진은 사용자에게 뉴스를 추천, 다른 하나는 사용자에게 친구를 제안하는 형태..
- 알고리즘은 반드시 각 엔진에 배포되어야 한다.
Algorithm
- 내장 알고리즘의 수는 엔진의 각 타입에 사용할 수 있다.
- 알고리즘, 파라미터의 설정은 예측모델(predictive model)을 어떻게 구성할지 결정한다.
- 예측 정확도와 성능은 상황에 맞는 적당한 알고리즘과 파라미터 설정을 통해 향상시킬 수 있다.
- 알고리즘 평가 툴 제공…

Data Collection

PredictionIO의 데이터 구조

PredictionIO App은 주로 3가지 타입의 데이터를 수집한다.

User Data
- required = UserID (String)
- 각 User 레코드는 어플리케이션에서 고유한 User 또는 Customer 다.
- 필수 속성은 UserId 이고, 일반적으로 database의 user id 와 일치한다.
- 또한, 나이, 성별, 위치, 소속 등의 여분의 데이터를 제공할 수 있다.
Item Data
- required = ItemID (String), Item type(String Array)
- Item 레코드는 Object 다.
- Object는 book, deal, music 등 어떤 컨텐츠이던간에 무엇이든 될 수 있다.
- Item 레코드는 2개의 필수 속성이 있다. ItemID, Item type
- 이외의 추가 데이터를 제공할 수 있다.
- UserID와 유사하게 ItemID는 일반적으로 database의 deal id 와 일치 한다.
- Item type은 String이고, Type은 item의 항목을 구분합니다.
Behavioral Data
- User-to-Item, User-to-User의 행위는 behavioral data로 수집된다.
- 이것은 예측모델(Predictive model)을 구성하기 위해 사용된다.
- behavior 레코드는 다음과 같이 정의된다. => User A likes Item _X, **like **_는 User-to-Item 의 action type이다.
  - PredictionIO의 내장 Action Type
    - like : 사용자가 좋아함
    - dislike : 사용자가 싫어함
    - rate : 사용자의 평가. 1~5 사이의 단계 점수 : 1 낮음, 5 높음, 3 중립. 커스터마이징 가능
    - **view : 유저가 본 Item, 분명히 표현하지 않은 선호가 될수 있다. **
    - conversion : 사용자의 분명히 표현한 강한 선호. ex) 구매, 다운로드 등..**
      **
- Action type 역시 커스터마이징 가능하다.