目前遇到的问题如下:

现在我有一个表1,A列是患者的ID,C列是患者入院的时间,I列是患者的诊断,可以看到患者同一次入院是可能有多个诊断的,每行只放一个诊断,这个表大约有80w条数据

这是我的另外一个表格表2,A列是患者进行某项检查的时间,C列是患者的ID。
我最终目的是想找到具有糖尿病或高血压的人,最好能够在表2中清楚的显示,如下图呈现的效果,1表示有,0表示无:

目前我自己考虑的方法是在筛选出表1中与表2患者ID对应的诊断数据,并判断诊断中是否含有肾脏病或糖尿病,由于诊断可能有不同写法,我觉得可能需要按某个关键字搜索,比如诊断中含有“肾”这个字。问题在于同一个患者可能多次入院,每次入院也可能有多个诊断,我想找到和表2检查时间最接近的时间得出的患者诊断。举个例子,患者1在表1中2013年和2014年都有数个诊断结果,在表2中只有2013年做过检查,那么就在表1该患者2013年的诊断中判断是否含有“肾”这个字,如果有的话,就在表2“肾脏病”一列中标记“1”。但是不知道如何处理
不知各位大佬是否有好的方法完成这个筛选,或者有其他更好的思路能达到我的最终目的?先谢过各位大佬了!

现在我有一个表1,A列是患者的ID,C列是患者入院的时间,I列是患者的诊断,可以看到患者同一次入院是可能有多个诊断的,每行只放一个诊断,这个表大约有80w条数据

这是我的另外一个表格表2,A列是患者进行某项检查的时间,C列是患者的ID。
我最终目的是想找到具有糖尿病或高血压的人,最好能够在表2中清楚的显示,如下图呈现的效果,1表示有,0表示无:

目前我自己考虑的方法是在筛选出表1中与表2患者ID对应的诊断数据,并判断诊断中是否含有肾脏病或糖尿病,由于诊断可能有不同写法,我觉得可能需要按某个关键字搜索,比如诊断中含有“肾”这个字。问题在于同一个患者可能多次入院,每次入院也可能有多个诊断,我想找到和表2检查时间最接近的时间得出的患者诊断。举个例子,患者1在表1中2013年和2014年都有数个诊断结果,在表2中只有2013年做过检查,那么就在表1该患者2013年的诊断中判断是否含有“肾”这个字,如果有的话,就在表2“肾脏病”一列中标记“1”。但是不知道如何处理

不知各位大佬是否有好的方法完成这个筛选,或者有其他更好的思路能达到我的最终目的?先谢过各位大佬了!