R数据框可以包含很多行,如果我们认为某些行对我们的数据分析没有帮助,那么我们可能希望删除它们。因此,我们可以在开始分析过程之前删除这些行。我们可以说删除某些行是数据清理的一部分,显然,数据清理有助于我们创建一个平滑的数据集进行分析。在R中,我们可以简单地使用head函数从R数据框中删除最后几行,如果愿意,我们也可以将它们存储为新数据框,但我仅向您展示如何删除这些行,您可以分配一个如果这样的话,将对象名称命名为新df。
请看以下数据帧-
set.seed(111) x1<-rnorm(20,2) x2<-LETTERS[1:20] x3<-rep(c("L1","L2","L3","L4"),times=5) x4<-rpois(20,5) x5<-sample(1:1000,20) df<-data.frame(x1,x2,x3,x4,x5) df
输出结果
x1 x2 x3 x4 x5 1 2.2352207 A L1 6 61 2 1.6692641 B L2 4 893 3 1.6883762 C L3 6 91 4 -0.3023457 D L4 8 605 5 1.8291240 E L1 5 855 6 2.1402782 F L2 4 864 7 0.5025733 G L3 4 373 8 0.9898116 H L4 7 493 9 1.0515244 I L1 6 769 10 1.5060378 J L2 7 252 11 1.8263259 K L3 6 170 12 1.5934012 L L4 5 592 13 3.8456363 M L1 1 42 14 2.3940541 N L2 4 423 15 2.7975285 O L3 12 388 16 0.4333346 P L4 5 308 17 1.9141490 Q L1 5 113 18 1.6408605 R L2 5 998 19 0.8063910 S L3 2 310 20 2.3641867 T L4 7 687
head(df,-5)
输出结果
x1 x2 x3 x4 x5 1 2.2352207 A L1 6 61 2 1.6692641 B L2 4 893 3 1.6883762 C L3 6 91 4 -0.3023457 D L4 8 605 5 1.8291240 E L1 5 855 6 2.1402782 F L2 4 864 7 0.5025733 G L3 4 373 8 0.9898116 H L4 7 493 9 1.0515244 I L1 6 769 10 1.5060378 J L2 7 252 11 1.8263259 K L3 6 170 12 1.5934012 L L4 5 592 13 3.8456363 M L1 1 42 14 2.3940541 N L2 4 423 15 2.7975285 O L3 12 388
head(df,-2)
输出结果
x1 x2 x3 x4 x5 1 2.2352207 A L1 6 61 2 1.6692641 B L2 4 893 3 1.6883762 C L3 6 91 4 -0.3023457 D L4 8 605 5 1.8291240 E L1 5 855 6 2.1402782 F L2 4 864 7 0.5025733 G L3 4 373 8 0.9898116 H L4 7 493 9 1.0515244 I L1 6 769 10 1.5060378 J L2 7 252 11 1.8263259 K L3 6 170 12 1.5934012 L L4 5 592 13 3.8456363 M L1 1 42 14 2.3940541 N L2 4 423 15 2.7975285 O L3 12 388 16 0.4333346 P L4 5 308 17 1.9141490 Q L1 5 113 18 1.6408605 R L2 5 998
head(df,-10)
输出结果
x1 x2 x3 x4 x5 1 2.2352207 A L1 6 61 2 1.6692641 B L2 4 893 3 1.6883762 C L3 6 91 4 -0.3023457 D L4 8 605 5 1.8291240 E L1 5 855 6 2.1402782 F L2 4 864 7 0.5025733 G L3 4 373 8 0.9898116 H L4 7 493 9 1.0515244 I L1 6 769 10 1.5060378 J L2 7 252
head(df,-8)
输出结果
x1 x2 x3 x4 x5 1 2.2352207 A L1 6 61 2 1.6692641 B L2 4 893 3 1.6883762 C L3 6 91 4 -0.3023457 D L4 8 605 5 1.8291240 E L1 5 855 6 2.1402782 F L2 4 864 7 0.5025733 G L3 4 373 8 0.9898116 H L4 7 493 9 1.0515244 I L1 6 769 10 1.5060378 J L2 7 252 11 1.8263259 K L3 6 170 12 1.5934012 L L4 5 592
head(df,-15)
输出结果
x1 x2 x3 x4 x5 1 2.2352207 A L1 6 61 2 1.6692641 B L2 4 893 3 1.6883762 C L3 6 91 4 -0.3023457 D L4 8 605 5 1.8291240 E L1 5 855
head(df,-4)
输出结果
x1 x2 x3 x4 x5 1 2.2352207 A L1 6 61 2 1.6692641 B L2 4 893 3 1.6883762 C L3 6 91 4 -0.3023457 D L4 8 605 5 1.8291240 E L1 5 855 6 2.1402782 F L2 4 864 7 0.5025733 G L3 4 373 8 0.9898116 H L4 7 493 9 1.0515244 I L1 6 769 10 1.5060378 J L2 7 252 11 1.8263259 K L3 6 170 12 1.5934012 L L4 5 592 13 3.8456363 M L1 1 42 14 2.3940541 N L2 4 423 15 2.7975285 O L3 12 388 16 0.4333346 P L4 5 308