2025年SEER数据库中肿瘤发病率计算并绘制发病率趋势图

SEER数据库中肿瘤发病率计算并绘制发病率趋势图我们上一张已经讲过如何把提取的数据随机分组 今天来讲讲怎么使用 SEER 数据库计算发病率趋势 在这之前 我们先来看一篇例文 题目 Incidence Prognostic Factors and Survival Outcome in Patients With Primary Hepatic Lymphoma

大家好,我是讯享网,很高兴认识大家。

在这里插入图片描述
讯享网
我们上一张已经讲过如何把提取的数据随机分组,今天来讲讲怎么使用SEER数据库计算发病率趋势,在这之前,我们先来看一篇例文,
题目:Incidence, Prognostic Factors and Survival Outcome in Patients With Primary Hepatic Lymphoma
在这里插入图片描述
在这里插入图片描述
作者计算了1983-2015发病率年度百分比变化和发病率走势图,使得发病率走势一目了然,是个加分项。我们今天来讲讲怎么像文章一样从SEER数据库提取发病率数据,并做出发病率走势图。
首先打开SEERStat软件输入账号连上数据库
在这里插入图片描述
然后点击左上角这个符号
在这里插入图片描述
然后会打开一个新的有统计的界面
在这里插入图片描述
点击statisc
在这里插入图片描述
然后在新界面选择第4个
在这里插入图片描述
然后点击selection
在这里插入图片描述
这个界面我们需要对年龄、性别和疾病诊断设定
在这里插入图片描述
我们这次是想比较男女发病率有什么不同,就不使用乳腺癌发病率了,因为乳腺癌发病率肯定是女性高啊,我们这次使用肝癌发病率
在这里插入图片描述
Table这里要加入性别
在这里插入图片描述
最后点击闪电图标就可以了,得到数据如下图,1975-2017的APC也给出来了,我们要把它导出整理一下
在这里插入图片描述
整理后得到如下结果就可以进行分析了
在这里插入图片描述
我们先导入我们需要的R包,ggplot2,splines,rms,stringr,然后我们把数据导入R并查看数据

library(ggplot2) library(splines) library(rms) library(stringr) be<-read.csv("E:/r/test/fabinglv2.csv",sep=',',header=TRUE) names(be) 

讯享网

在这里插入图片描述
在这里插入图片描述
“all.year” 和"all.Rate"代表肝癌的年份和发病率,
“year”、“sex”、“Rate” 表示分组的年份、性别和发病率
我们先绘制散点图查看数据结构

讯享网ggplot(be, aes(be$all.year, be$all.Rate) )+geom_point()#绘制散点图 

在这里插入图片描述
这个图形看起来不像直线关系,我们来模型拟合一下,在这之前还要处理一下年份的数据结构,因为它不是数字类型的,分析不了

be$all.year<-str_extract(be$all.year, "\\d+")#把年龄里面的数字提取出来 be$year<-str_extract(be$year, "\\d+")#把年龄里面的数字提取出来 be$year<-as.numeric(be$year) be$all.year<-as.numeric(be$all.year) be$sex<-as.factor(be$sex) 把它们转成数字类型后就可以分析了 model.spline <- lm(be$all.year ~ rcs(be$all.year))#建立样条回归 summary(model.spline) P值小于0.05,可以确定是非线性关系了 

在这里插入图片描述
开始绘制图形,先绘制总发病率的

讯享网ggplot(be, aes(be$all.year, be$all.Rate)) + geom_point()+geom_line()+ stat_smooth(method = lm, formula = y ~ rcs(x,5)) 

在这里插入图片描述
可以美化一下

ggplot(be, aes(be$all.year, be$all.Rate)) + geom_point(shape=21,size=4,col="black",fill="black")+geom_line(linetype=1,size=1)+ stat_smooth(method = lm, formula = y ~ rcs(x,5)) 对图形美化 

在这里插入图片描述
分别绘制男女的肝癌发病率

讯享网ggplot(be, aes(be$year, be$Rate,group=sex)) + geom_point()+geom_line()+ stat_smooth(method = lm, formula = y ~ rcs(x,5)) 

在这里插入图片描述
可以再美化一下
在这里插入图片描述

图形做完了,几乎和上面论文的图一模一样,甚至还要美观一点。我们这里1是男性,2是女性,可以看出男性的肝癌发病率要明显的高。
本内容讲到这里,SCI论文需要的结果我们已经全部做出来了,您有心的话已经完全可以自己使用SEER数据库做一篇自己的文章了,还等什么呢?
要是觉得R语言代码太麻烦,我们在科研教程也总结了一套使用SPSS和stata对SEER数据库挖掘的教程,相对简单了许多,欢迎订阅。
更多精彩文章尽在公众号:零基础说科研
在这里插入图片描述

小讯
上一篇 2025-03-23 08:30
下一篇 2025-04-07 15:58

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/13417.html