2020.02.12 복습_기업가치결정모형 및 부도모형


2020.02.12 복습_기업가치결정 및 부도모형 

데이터 링크 (별도 작업이 필요없습니다.)

#01 데이터 읽기

library(readxl)
fn <- read_excel("findata000.xls")
View(fn)

#02 데이터 통계량 보기
summary(fn)

#03 데이터 결측치 제거 
fn01<-na.omit(fn)

#04 데이터 단위 변경
fn02<-fn01
fn02$value_2018<-fn02$value_2018/100000000 #억단위
summary(fn02)

#05 주가, 매출액, 당기순이익이 가장 높은 "기업명" 불러오기

a<-which.max(fn02$price03) #값의 위치
b<-which.max(fn02$sale) #값의 위치
c<-which.max(fn02$ni) #값의 위치 
ak<-fn02[a,3] #기업 명을 불러온다 
bk<-fn02[b,3] #기업 명을 불러온다 
ck<-fn02[c,3] #기업 명을 불러온다 
zz<-c(ak,bk,ck) # 기업명을 한꺼 번에 출력 
zz

#06 교차 분석표 만들기 : 빈도분석(범주형 자료)
#대기업, 중소기업, 금융기업, 비금융 기업을 한번에 보고 싶다.


install.packages("gmodels")
library("gmodels")
z<-CrossTable(fn02$size,fn02$indus)


#07 가설검정 

#07-01 상관계수 구해보기

# 주가와 매출액과의 상관관계  
cor(fn02$price03, fn02$sale) 
plot(fn02$price03, fn02$sale)

library("ggplot2")

pp1<-ggplot(data=fn02, aes(x=sale, y=price03)) + geom_point(aes(size=price03, color=price03))




library("ggplot2")
pp1<-ggplot(data=fn02, aes(x=sale, y=price03)) + geom_point(aes(size=price03, color=price03))
pp1








cor.test(fn02$price03, fn02$sale)


#07-01 분석결과
# Pearson's product-moment correlation
# data:  fn02$price03 and fn02$sale
# t = 2.5535, df = 767, p-value = 0.01086
# alternative hypothesis: true correlation is not equal to 0
# 95 percent confidence interval:
#  0.02125151 0.16146199
# sample estimates:
# cor
# 0.0918118

# 귀무가설 : null hypothesis: true correlation is equal to 0
# 대립가설 : alternative hypothesis: true correlation is not equal to 0
# P-VALUE : 0.01086(0.5보다 작다 5%수준에서 유의적임)

#여러 옵션 주기
cor.test(fn02$price03, fn02$sale, var.equal=T, alt="two.sided")
cor.test(fn02$price03, fn02$sale, var.equal=T, alt="two.sided")


#07-02 다른 변수로 상관관계 구해보기 
cor(fn02$price03, fn02$price02) 
plot(fn02$price03, fn02$price02)

library("ggplot2")
pp2<-ggplot(data=fn02, aes(x=price03, y=price02)) + geom_point(aes(size=price03, color=price03))
pp2

cor.test(fn02$price03, fn02$price02)

pp2 + stat_smooth(color='black', fill='grey')+facet_wrap(~indus)
pp1 + stat_smooth(color='black', fill='grey')+facet_wrap(~indus)

#08 회귀분석
lm=lm(fn02$price03~fn02$sale+fn02$ni)
summary(lm)

lm=lm(fn02$price03~fn02$sale+fn02$ni+fn02$op)
summary(lm)

## 변수를 늘려 가면서 해보기

------------------------------------------------------------------------------------------
#Call:
# lm(formula = fn02$price03 ~ fn02$sale + fn02$ni + fn02$op + fn02$size + 
    fn02$cash)

Residuals:
    Min      1Q  Median      3Q     Max 
-167817  -39679  -28282   -2600 1568626 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)   
(Intercept)  9708.7864 10981.2111   0.884  0.37691   
fn02$sale       0.2958     0.1118   2.645  0.00834 **
fn02$ni         2.3855     2.3476   1.016  0.30988   
fn02$op        -0.5699     2.2249  -0.256  0.79791   
fn02$size   34705.8961 11801.7205   2.941  0.00337 **
fn02$cash      -1.9614     1.5197  -1.291  0.19721   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 108100 on 763 degrees of freedom
Multiple R-squared:  0.0255, Adjusted R-squared:  0.01911 
F-statistic: 3.993 on 5 and 763 DF,  p-value: 0.001395

--------------------------------------------------------------------------------------------

#09 부도 모형 만들어 보기 

#기업의 잔존가치 : 기업의 시장가치와 부채와 비교


fn03<-fn02 #t새롭게 변수를 추가할 예정이므로 
fn03$k<-fn02$value_2018-fn02$lia
summary(fn03$k)

(퀴즈#1) 범주형 자료로 바꿔 보세요 : 0이하면부도위험  0보다 크면 안전 

cor(fn03$k,fn03$price03)  
plot(fn03$k,fn03$price03)
cor.test(fn03$k,fn03$price03) ## 무슨 가설을 검정한 것일까요?


(참고) 시각화
pp3<-ggplot(data=fn02, aes(x=price03, y=fn03$k)) + geom_point(aes(size=price03, color=price03))
pp3



  






댓글