lierre

예제로 배우는 sas 데이터 분석 입문 연습문제

이것은 분석을 사용하여 수행할 수 있는 일입니다. 정보를 수집하고...

02 Août

이것은 분석을 사용하여 수행할 수 있는 일입니다. 정보를 수집하고 분석하고 더 나은 결정을 내릴 수 있습니다. 위의 예제는 간단했기 때문에 몇 가지 가정을 기반으로 결정을 내릴 수 있습니다. 문제와 의사 결정이 쉽지 않다면 어떨까요? 이 진술은 데이터 및 PROC 단계를 구성합니다. 단계의 길이는 1개에서 100개 이상의 문까지 다를 수 있습니다. PROC 단계는 데이터를 분석하거나 유틸리티 기능을 수행하거나 보고서를 인쇄하는 데 사용되는 반면 DATA 단계는 데이터를 읽고 수정하는 데 사용된다는 점을 기억해야 합니다. 이 단방향 ANOVA 모델을 분산의 2단계 해석으로 확장한 다음 두 개의 예측 변수를 사용하여 단순 선형 회귀를 여러 회귀로 확장합니다. 양방향 ANOVA및 두 개의 예측 변수를 사용하여 다중 선형 회귀의 개념을 이해하면 많은 변수를 사용하여 모델을 맞추고 해석할 수 있는 기술을 갖게 됩니다. 마찬가지로 프로시저는 PROC 라는 키워드가 사용된 프로시저의 이름을 따르는 PROC 문으로 시작합니다(예: 프로시저의 이름은 PRINT, SORT 또는 MEAN일 수 있음). SAS 절차에는 대부분 몇 가지 가능한 문이 있습니다. 다음 단계는 SAS 대학 에디션을 설치하는 데 도움이 됩니다. SAS 프로그래밍을 연습할 수 있는 소프트웨어입니다.

SAS 인스티튜트 Inc는 무료로 사용할 수있는 SAS 대학 에디션을 출시했기 때문에 이제 초보자는 SAS를 배우고 연습 할 수 있습니다. 기본 SAS를 배우는 데 필요한 모든 기능은 여기에서 확인할 수 있습니다. 기본 SAS를 학습하면 다른 구성 요소를 쉽게 배울 수 있습니다. 이 단원에서는 모델의 가정을 확인하고 선형 회귀에서 발생하는 문제를 진단하는 방법을 배웁니다. 잔류를 검사하고, 대량의 데이터에서 수치적으로 멀리 떨어진 이상값을 식별하고, 회귀 모델에 부당하게 영향을 주는 영향력 있는 관측값을 식별하는 방법을 배웁니다. 마지막으로 모델에서 팽창된 표준 오류 및 매개변수 불안정성을 방지하기 위해 공선성을 진단하는 방법을 배웁니다. 이 입문 과정은 통계 분석을 위해 SAS/STAT® 소프트웨어를 사용하는 SAS 소프트웨어 사용자를 위한 과정입니다. 통계 분석 커리큘럼의 많은 과정의 전제 조건입니다.

이 단원에서는 다양한 유형의 데이터를 분석하는 데 필요한 모델과 설명과 예측 모델링의 차이점에 대해 알아봅니다. 그런 다음 평균의 샘플링 분포, 가설 테스트, p-값 및 신뢰구간과 같은 기본 통계 개념을 검토합니다. 이러한 개념을 검토한 후 데이터에 1개 샘플 및 2표본 t 검정을 적용하여 선입견을 확인하거나 거부합니다. 데이터 단계를 사용하여 프로그램을 시작하여 SAS 데이터 집합을 만든 다음 데이터를 PROC 단계로 전달합니다. PROC 단계는 데이터를 처리합니다. DATA 및 PROC 단계의 작동 방식을 이해하기 위해 아래 예제를 살펴보겠습니다. 비즈니스 관점에서 이 문제를 고려하십시오. 전자 상거래 회사가 이전 데이터를 기반으로 고객의 구매 패턴을 연구하려고 한다고 가정합니다. 회사는 수천 개의 레코드를 고려해야 하지 않습니까? 이제 방금 이야기한 데이터 나 순열 및 조합이 사람들이 가질 수있는 다른 환경 설정에 대해 고려할 수 있다고 상상해보십시오.

SQL을 이미 알고 있다면 PROC SQL을 만드는 데 SAS에 감사를 표할 것입니다. SQL을 모르더라도 SAS에서 일상적인 데이터 관리 작업을 수행하는 것이 더 쉬울 수 있습니다. 이 SUGI 논문에서 볼 수 있습니다: PROC SQL 소개 더 자세한 자습서를 필요로 하는 경우, 이 자습서를 볼 수 있습니다-PROC SQL 소개 아래 페이지는 예제를 포함 (종종 가설) 다른 통계의 응용 프로그램을 설명 하는 다양한 통계 패키지를 사용하여 분석 기술을 사용할 수 있습니다.