Publish to my blog (weekly)
-
Learn TensorFlow: Linear Regression - DZone AI
-
- features
- input
- ouput
- target
- a training example
- A pair (xi, yi)
- a training set
- A list of m training examples {xi, yi; i = 1,…,m}
- the space of input values
- Y
- X
- the space of output values
- a hypothesis or a model
- h(x) is a good predictor for the corresponding value of y
- A function h: X -> Y
- When the target variable that we are trying to predict is continuous
- a regression problem
- When y takes on only a small number of discrete values,
-
a classification problem.
- the wi’s are the parameters (also called weights)
- To simplicity, we also assume that x0 = 1 and our h(x) can look like this:
- w and x both as vectors
- how can we get the weights w?
- o define a cost function that is used to compute error as the difference between predicted h(x) and the actual y.
- We want to choose w so as to minimize costF(w).
- To do this, we are going to use a gradient descent algorithm
-
-
[Excel 활용 정석] 차트 종류와 상황별 용법 정리 : 네이버 포스트
- 차트의 형태를 결정하기 전에 무슨 메시지를 전하고자 하는지를 분명히 해야 합니다.
- 강조하려는 요점을 정했다면 이것을 5가지 비교 유형 중 어느 것에 해당하는지 확인합니다
- (1) 구성 요소 비교
- 각 부분의 크기를 전체의 백분율로 나타내는 것이 주된 목적입니다.
- (2) 항목 비교
- 비교 대상 항목들 간의 순위를 비교합니다.
- (3) 시간 추이 비교
- 전체 중에서 차지하는 비교가 아니라 대상이 시간에 따라 어떻게 변화하는지를 보여줍니다.
- (4) 도수분포 비교
- (5) 상관관계 비교
- 변수들 간의 상관성을 비교합니다.
- - 구성: 전체의 백분율
- 항목: 항목의 순위
- 시간 추이: 시간에 따른 변화
- 도수분포: 범위에 포함되는 항목의 수
- 상관관계: 변수 사이의 관계
-
-
- 1. 시간에 따른 트렌드
- 시간에 따른 그 트렌드를 보여주기 위한 가장 좋은 시각화 중에 line 차트, area 차트, bar 차트들이 있다고 한다.
- 각 카테고리(각각의 다른 색깔 선)의 시간에 따른 트렌드와 카테고리들간의 차이점
- 라인 차트
- bar 차트는 각각의 달(Month)을 하나의 패턴
- area 차트는 각 카테고리를 하나의 패턴
- 2. 비교와 순위 매기기
- 무언가를 비교하고 순위를 매길 때는 bar 차트를 쓰는 것이 좋은 방법이다
- 3. 연관성(Correlation)
- 두 대상들 사이의 관계를 알기 위해서는 산포도(scatter plot)
- 4. 분포 (Distribution)
- 분포 분석은 데이터 값들이 전체 범위들 사이에서 얼마나 퍼져있는지를 보여주는 방법
- 5. Part to Whole
-
이 bar 차트의 데이터는 저 파이 차트를 사용한 그림의 데이터와 같다. 하지만 이 막대 차트를 보면, 30-39 그룹의 white collar job이 가장 많다는 것을 알 수 있다.
- 6. Geographical Data
-
댓글