2020.02.12 복습_기업가치결정 및 부도모형
데이터 링크 (별도 작업이 필요없습니다.)
#01 데이터 읽기
library(readxl)
fn <- read_excel("findata000.xls")
View(fn)
#02 데이터 통계량 보기
summary(fn)
#03 데이터 결측치 제거
fn01<-na.omit(fn)
#04 데이터 단위 변경
fn02<-fn01
fn02$value_2018<-fn02$value_2018/100000000 #억단위
summary(fn02)
#05 주가, 매출액, 당기순이익이 가장 높은 "기업명" 불러오기
a<-which.max(fn02$price03) #값의 위치
b<-which.max(fn02$sale) #값의 위치
c<-which.max(fn02$ni) #값의 위치
ak<-fn02[a,3] #기업 명을 불러온다
bk<-fn02[b,3] #기업 명을 불러온다
ck<-fn02[c,3] #기업 명을 불러온다
zz<-c(ak,bk,ck) # 기업명을 한꺼 번에 출력
zz
#06 교차 분석표 만들기 : 빈도분석(범주형 자료)
#대기업, 중소기업, 금융기업, 비금융 기업을 한번에 보고 싶다.
install.packages("gmodels")
library("gmodels")
z<-CrossTable(fn02$size,fn02$indus)
#07 가설검정
#07-01 상관계수 구해보기
# 주가와 매출액과의 상관관계
cor(fn02$price03, fn02$sale)
plot(fn02$price03, fn02$sale)
library("ggplot2")
pp1<-ggplot(data=fn02, aes(x=sale, y=price03)) + geom_point(aes(size=price03, color=price03))

library("ggplot2")
pp1<-ggplot(data=fn02, aes(x=sale, y=price03)) + geom_point(aes(size=price03, color=price03))
pp1
#07-01 분석결과
# Pearson's product-moment correlation
# data: fn02$price03 and fn02$sale
# t = 2.5535, df = 767, p-value = 0.01086
# alternative hypothesis: true correlation is not equal to 0
# 95 percent confidence interval:
# 0.02125151 0.16146199
# sample estimates:
# cor
# 0.0918118
# 귀무가설 : null hypothesis: true correlation is equal to 0
# 대립가설 : alternative hypothesis: true correlation is not equal to 0
# P-VALUE : 0.01086(0.5보다 작다 5%수준에서 유의적임)
#여러 옵션 주기
cor.test(fn02$price03, fn02$sale, var.equal=T, alt="two.sided")
cor.test(fn02$price03, fn02$sale, var.equal=T, alt="two.sided")
#07-02 다른 변수로 상관관계 구해보기
cor(fn02$price03, fn02$price02)
plot(fn02$price03, fn02$price02)
library("ggplot2")
pp2<-ggplot(data=fn02, aes(x=price03, y=price02)) + geom_point(aes(size=price03, color=price03))
pp2
cor.test(fn02$price03, fn02$price02)
pp2 + stat_smooth(color='black', fill='grey')+facet_wrap(~indus)
pp1 + stat_smooth(color='black', fill='grey')+facet_wrap(~indus)
#08 회귀분석
lm=lm(fn02$price03~fn02$sale+fn02$ni)
summary(lm)
lm=lm(fn02$price03~fn02$sale+fn02$ni+fn02$op)
summary(lm)
## 변수를 늘려 가면서 해보기
------------------------------------------------------------------------------------------
#Call:
# lm(formula = fn02$price03 ~ fn02$sale + fn02$ni + fn02$op + fn02$size +
fn02$cash)
Residuals:
Min 1Q Median 3Q Max
-167817 -39679 -28282 -2600 1568626
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9708.7864 10981.2111 0.884 0.37691
fn02$sale 0.2958 0.1118 2.645 0.00834 **
fn02$ni 2.3855 2.3476 1.016 0.30988
fn02$op -0.5699 2.2249 -0.256 0.79791
fn02$size 34705.8961 11801.7205 2.941 0.00337 **
fn02$cash -1.9614 1.5197 -1.291 0.19721
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 108100 on 763 degrees of freedom
Multiple R-squared: 0.0255, Adjusted R-squared: 0.01911
F-statistic: 3.993 on 5 and 763 DF, p-value: 0.001395
--------------------------------------------------------------------------------------------
#09 부도 모형 만들어 보기
#기업의 잔존가치 : 기업의 시장가치와 부채와 비교
fn03<-fn02 #t새롭게 변수를 추가할 예정이므로
fn03$k<-fn02$value_2018-fn02$lia
summary(fn03$k)
(퀴즈#1) 범주형 자료로 바꿔 보세요 : 0이하면부도위험 0보다 크면 안전
cor(fn03$k,fn03$price03)
plot(fn03$k,fn03$price03)
cor.test(fn03$k,fn03$price03) ## 무슨 가설을 검정한 것일까요?
(참고) 시각화
pp3<-ggplot(data=fn02, aes(x=price03, y=fn03$k)) + geom_point(aes(size=price03, color=price03))
pp3
댓글
댓글 쓰기