stata学习笔记(二):固定宽度型数据导入

一、何为固定宽度型数据

    有固定宽度的,某个或某几个数位上的数字表示某一类信息的数据。最简单明了的例子,你的身份证号。

    有rawtxt两种数据文件格式。

二、导入步骤

  1. 依据数据的特点编写.dct 文件,文件中需说明读入数据的路径和名称。
  2. 使用infile 命令读入.dct 文件,一般为:
.infile using dfilename[if][in][, options]  //dfilename 就是.dct 文件,需要带路径;

例子(dct文件和do-file文件):

1 dictionary using D:Stata12.0data.txt {//表明这是个.dct 文件,同时using 后面是表示对应读入的数据是D 盘Stata12.0目录下的data.txt 文件
2 _lines(2)  //每两行作为一条记录读入
3 _line(1)  //表明先从第1 行读起
4 _column(1)  //表明先从第1 列开始读
5 long idnumb %9f "Identification number"  //读入9 个宽度的长整型
6 str6 sex %6s "Sex"  //6 个宽度的字符型
7 int age %2f "Age"  //2 个宽度的整数型数据
8 _column(24)  //表明让光标直接跳到第24 列,这通常是因为中间有空格而采取的做法
9 float income %6f "Income"  //:双引号部分是对变量的补充说明,我们称之为“加标签”
10 _line(2)  //跳到数据文件第2 行开始读
11 str9 eval %9s "Evaluation"
12 }
13 //:.dct文件的最后一行需要空出来,否则会报错。数据文件的最后一行也要空出来
1 infile using score.dct, clear
2 list

原文地址:https://www.cnblogs.com/pursuit1996/p/4608372.html