网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
03月07日
漏签
0
天
erbi_lucifer吧
关注:
406
贴子:
3,325
看贴
图片
吧主推荐
游戏
1
2
下一页
尾页
16
回复贴,共
2
页
,跳到
页
确定
<返回erbi_lucifer吧
>0< 加载中...
简单数据整理分析(二)
只看楼主
收藏
回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
送TA礼物
1楼
2013-06-08 16:33
回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
接:
http://tieba.baidu.com/p/2380043753
2楼
2013-06-08 16:38
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
a. 按行数或要求分割文件数量进行分割的程序。
要分割的数据都是文本型的,并且每一条数据占用一行,按行数分割很方便实用。
程序名:cutfile.exe
作用:按行切割文本文件
使用:cutfile 要切割的文件模式(line:根据行数,page:根据要生成的文件数)数值(行数或生成文件数)
使用:
cutfile 1.txtline 1000
cutfile 1.txtpage 10
4楼
2013-06-08 16:40
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
例子: cutfile cnhonkerarmy.com.sql line 10000
将一个文件切割为4份,每份约10000行。
其实这个小程序很简单,打开文件,读取数据,写入新文件,然后就没有然后了,源代码见附件。
5楼
2013-06-08 16:41
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
a. 将几个小文本文件连接成一个大文本文件。特别是用于还原分割数据或下面这种类型的文件。
程序名:confile.exe
作用:合并文件
使用:confile 要保存的文件名源文件名格式化字符串起始数值 结束数值 每次增量
使用:
confileall.txt page_%d.txt 1 10 1
6楼
2013-06-08 16:42
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
例子: confile Allinformation.txt 考试大论坛%d.txt 0341 1
要合并的文件:
合并过程:
共337个文件,其中的66-70是没有的,会自动跳过。
7楼
2013-06-08 16:44
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
合并后的文件:
原理很简单,不断打开读取文件然后统一写入同一个文件即可,源代码见附件。以上两个小程序只可以用于文本文件的操作。
8楼
2013-06-08 16:45
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
六、多个HTML文件数据提取--广播电视资格考试报名审核表
9楼
2013-06-08 16:46
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
提取方法:分析HTML文件(3W个html的大体格式是一样的,就是信息内容不同),编写提取程序。
11楼
2013-06-10 21:49
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
数据如:
<palign="center" ><strong>2012年广播电视编辑记者、播音员主持人 </strong></p> <palign="center"><strong>资格考试报名审核表 </strong></p></div><tablewidth="620" border="0" cellpadding="0" cellspacing="0"align="center" style = "font-size:14px;"> <tr> <td> 网报号:363000 </td> </tr></table><tablewidth="620" border="0" cellpadding="0" cellspacing="0"class="tboder" align="center" style ="font-size:14px;"> <tr> <td width="70"height="40" class="tdtop" align = "center">姓 名</td> <td width="142" class="tdtop"style="padding-left:3px"> 卢晓美 </td> <td width="46"align="center" class="tdtop" >性别</td> <td width="45"class="tdtop" align="center">女 </td> <td width="72"class="tdtop" align="center">出生日期</td> <td width="96"class="tdtop" style="padding-left:3px">1989-04-07 </td> <td width="133"rowspan="4" class="tdtop"align="center"><imgsrc='../upload/2012/4100/03630002010129.jpg' width="133"height="179"></td> </tr> <tr> <td class="tdbom"height="40" align = "center">民 族</td> <td class="tdbom"style="padding-left:3px">汉族 </td>
我们找出信息所在的对应位置,然后一个个提取。
12楼
2013-06-10 21:50
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
nexttmp=Getter(tmp,pci.name,"padding-left:3px\">",'<');
传入:剩下的文件内容,指纹“padding-left:3px">”,结束符‘<’(姓名后面跟着的是“</td>”,故从指纹到字符‘<’,中间的就是名字)故提取到结果:“卢晓美 ”
在经过DeleteSpace去掉无关字符,得到结果“卢晓美”
14楼
2013-06-10 21:51
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
例子:
2012S 363000 363000 2012s.txt (昨天提取完把html都删除了。= =|||,幸好还找到一个html文件,以一个文件作为例子吧)。
提取过程中只会提示打开失败的文件(不存在),打开失败的会跳过不处理。
提取结果:
16楼
2013-06-10 21:53
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
七、sqlmap日志分析整理—126网盘用户信息
18楼
2013-06-10 21:54
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
(详细见:user.qzone.qq.com/1264534037/infocenter#!app=2&via=QZ.HashRefresh&pos=1357308171
这里只是将之前写的整合过来作为一个专题。)
19楼
2013-06-10 22:03
回复
收起回复
堕erbi
幻魔梦魇
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
处理目标:
(这是12年的事情了,截图是以前的,现在那个日志文件已经删除了)
附sqlmap的简单使用:
http://tieba.baidu.com/p/2031516695
20楼
2013-06-10 22:06
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
如何评价华莱士推出丁真套餐
1813050
2
哪吒也被拷打血统论了
1540248
3
群星纪元临界终测开启
1225224
4
你会买《双影奇境》吗?
961524
5
来自米哈游学长的语录合订本
737256
6
AI新星Manus横空出世
626675
7
考研名师被锤成绩造假删号跑路
465432
8
大伙们今年退税还是补税 ?
332695
9
绝区零新代理人薇薇安公布
280038
10
玩三角洲要不要遵守村规
276969
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示