Publish to my blog (weekly)

    • Learn TensorFlow: Linear Regression - DZone AI
    • features
    • input
    • ouput
    • target
    • a training example
    • A pair (xi, yi)
    • a training set
    • A list of m training examples {xi, yi; i = 1,…,m}
    • the space of input values
    • Y
    • X
    • the space of output values
    • a hypothesis or a model
    • h(x) is a good predictor for the corresponding value of y
    • A function h: X -> Y
    • When the target variable that we are trying to predict is continuous
    • a regression problem
    • When y takes on only a small number of discrete values,
    • a classification problem.

       

    • the wi’s are the parameters (also called weights)
    • To simplicity, we also assume that x­0 = 1 and our h(x) can look like this:
    • w and x both as vectors
    • how can we get the weights w?
    • o define a cost function that is used to compute error as the difference between predicted h(x) and the actual y.
    • We want to choose w so as to minimize costF(w).
    • To do this, we are going to use a gradient descent algorithm
    • 차트의 형태를 결정하기 전에 무슨 메시지를 전하고자 하는지를 분명히 해야 합니다.
    • 강조하려는 요점을 정했다면 이것을 5가지 비교 유형 중 어느 것에 해당하는지 확인합니다
    • (1) 구성 요소 비교
    • 각 부분의 크기를 전체의 백분율로 나타내는 것이 주된 목적입니다.
    • (2) 항목 비교
    • 비교 대상 항목들 간의 순위를 비교합니다.
    • (3) 시간 추이 비교
    • 전체 중에서 차지하는 비교가 아니라 대상이 시간에 따라 어떻게 변화하는지를 보여줍니다.
    • (4) 도수분포 비교
    • (5) 상관관계 비교
    • 변수들 간의 상관성을 비교합니다.
    • - 구성: 전체의 백분율
      - 항목: 항목의 순위
      - 시간 추이: 시간에 따른 변화
      - 도수분포: 범위에 포함되는 항목의 수
      - 상관관계: 변수 사이의 관계
    • 1. 시간에 따른 트렌드
    • 시간에 따른 그 트렌드를 보여주기 위한 가장 좋은 시각화 중에 line 차트, area 차트, bar 차트들이 있다고 한다. 
    • 각 카테고리(각각의 다른 색깔 선)의 시간에 따른 트렌드와 카테고리들간의 차이점
    • 라인 차트
    • bar 차트는 각각의 달(Month)을 하나의 패턴
    • area 차트는 각 카테고리를 하나의 패턴
    • 2. 비교와 순위 매기기
    • 무언가를 비교하고 순위를 매길 때는 bar 차트를 쓰는 것이 좋은 방법이다
    • 3. 연관성(Correlation)
    • 두 대상들 사이의 관계를 알기 위해서는 산포도(scatter plot)
    • 4. 분포 (Distribution)
    • 분포 분석은 데이터 값들이 전체 범위들 사이에서 얼마나 퍼져있는지를 보여주는 방법
    • 5.  Part to Whole
    • 이 bar 차트의 데이터는 저 파이 차트를 사용한 그림의 데이터와 같다. 하지만 이 막대 차트를 보면, 30-39 그룹의 white collar job이 가장 많다는 것을 알 수 있다. 

    • 6.  Geographical Data

Posted from Diigo. The rest of my favorite links are here.

댓글

이 블로그의 인기 게시물

Publish to my blog (weekly)

Publish to my blog (weekly)