高中大学时候当过几年脚本小子
后来编程学了点,c/c++/asm,打算做逆向的中途放弃
前两年心血来潮学了一阵 Python,能简单写个 blog 之类
那时候认识一个小兄弟,一直有联系,逢年过节会打电话问候那种;现在也是为人父母了,他灰产接触比较多,有社工库需求,找我帮忙,目标数据量应该在 500G ;
做了下前期工作,目前初步方案是数据索引 elasticsearch,查询用 Python+flask ;自用随便整个页面就可以了;
想咨询下有没有更好的方案,或者这套方案有没有大的短板;
还有就是数据清洗有没有成熟的方案还是只能自己写个脚本导入
后来编程学了点,c/c++/asm,打算做逆向的中途放弃
前两年心血来潮学了一阵 Python,能简单写个 blog 之类
那时候认识一个小兄弟,一直有联系,逢年过节会打电话问候那种;现在也是为人父母了,他灰产接触比较多,有社工库需求,找我帮忙,目标数据量应该在 500G ;
做了下前期工作,目前初步方案是数据索引 elasticsearch,查询用 Python+flask ;自用随便整个页面就可以了;
想咨询下有没有更好的方案,或者这套方案有没有大的短板;
还有就是数据清洗有没有成熟的方案还是只能自己写个脚本导入