MAXPDA论坛 » PDA医学应用区 » 转换ZDic可用的药物字典

2008-4-30 12:48 zhangjie203203
转换ZDic可用的药物字典

[size=5][color=red][color=black]转换ZDic可用的药物字典分好几个步骤,我现在先把大概思想给大家说一下,如果还有不明的地方,比如有些步骤不会操作,大家可以跟帖,我会解答大家集中的问题。[/color]

1、从网上下载药物词典,下载网站,我一般用的是Webdup,下载地址是[/color][/size][url=http://www.webdup.com][size=5][color=red]http://www.webdup.com[/color][/size][/url][size=5][color=red]。具体使用方法,大家可用看一下说明。

2、把下载的网页转换成iSilo,这个可用用iSiloX。

3、用iSilo的Windows版,把做好的电子书另存为txt格式的文件。
[attach]184048[/attach]      [attach]184049[/attach]

4、用Word打开txt格式的那个文件,寻找药物和下一个药物之间重复的文字,把它替换一下。替换操作我重点说一下换行符,换行符是用^p表示的,也就是一个^p表示一个换行符,^p^p就表示两个换行符。常用的替换有多个空格替换为1个空格,一个普通字符替换为特殊字符。大家可用揣摩一下。
[attach]184050[/attach]

[attach]184051[/attach]

[attach]184052[/attach]


5、替换完成后,保存一下。

6、打开Excel,执行 数据-导入外部数据-导入数据,把替换后的txt文件导入。
[attach]184053[/attach]

[attach]184054[/attach]

[attach]184055[/attach]

[attach]184056[/attach]

[attach]184057[/attach]

[attach]184058[/attach]

[attach]184059[/attach]

[attach]184060[/attach]

[attach]184061[/attach]



7、在Excel里进行一些整理。提取药物名称的首字母(具体方法见2楼),再保存一下,保存为txt格式的,选制表符分隔的那种格式。

8、再用Word打开刚刚保存的文件,根据需要,把制表符,就是看起来像一个打空格一样的字符替换为所需文字。

9、这样源文件就生成了。[/color][/size]

[[i] 本帖最后由 zhangjie203203 于 2008-4-30 13:21 编辑 [/i]]

2008-4-30 12:53 zhangjie203203
如何提取词条的首字母

先下载附件里的软件[attach]184070[/attach]

1、先在excel里把词条按字母排序。
2、保存成csv格式。
3、导入Palm同步软件的通讯录里,然后再导出。(必须,不然没法用这个软件提取。)
4、用这个软件提取首字母,然后保存。
5、和原来的excel文件合并。

注意:35图和33图FirstName和LastName的位置是不一样的。

也可以参看[url]http://bbs.tompda.com/viewthread.php?tid=2039451&extra=page%3D1%26amp%3Bfilter%3Ddigest[/url]

[[i] 本帖最后由 zhangjie203203 于 2008-4-30 16:50 编辑 [/i]]

2008-4-30 12:54 zhangjie203203
最后一步---转换源文件为ZDic字典

下载[attach]184082[/attach]批处理这个压缩包,解压到一个文件夹,把前面转换的源文件改名为source.txt,覆盖这个文件夹里的source.txt,运行转换.bat就好了。

[attach]184081[/attach]

[[i] 本帖最后由 zhangjie203203 于 2008-4-30 13:39 编辑 [/i]]

2008-4-30 13:32 zhangjie203203
整理下载的网页

[size=5][color=red]前面的步骤掉了一步,就是网页下载下来后得删除哪些广告等无用的东西。这个最好是能看懂代码。直接删除相关代码。每个页面一般都有相似的需要删除的字符,我用的AFR(advanced find and replace)。附件里是汉化XX的。[/color][/size]

[attach]185422[/attach]

[[i] 本帖最后由 zhangjie203203 于 2008-5-3 21:40 编辑 [/i]]

2008-4-30 13:41 zhangjie203203
再发一个替换文本的工具。

这个超强,可以进行 [size=6][color=red]特征字符串之间替换[/color][/size]。

[[i] 本帖最后由 zhangjie203203 于 2008-9-2 13:42 编辑 [/i]]

2008-4-30 18:05 chy7719
[b]打开webdup时卡巴斯基报发现木马程序……[/b]

2008-5-1 21:58 zhangjie203203
[quote]原帖由 [i]chy7719[/i] 于 2008-4-30 18:05 发表 [url=http://bbs.maxpda.com/redirect.php?goto=findpost&pid=1494284&ptid=128069][img]http://bbs.maxpda.com/images/common/back.gif[/img][/url]
打开webdup时卡巴斯基报发现木马程序…… [/quote]

原来下载过,没事啊。不过我一直用的金山毒霸。应该没事吧,要不你把卡巴关了,装,然后再开卡巴杀毒。中个木马没什么大不了的把?呵呵

2008-5-1 22:23 chy7719
webdup的几个页面都报木马!!!……

2008-5-3 21:25 zhangjie203203
[quote]原帖由 [i]chy7719[/i] 于 2008-5-1 22:23 发表 [url=http://bbs.maxpda.com/redirect.php?goto=findpost&pid=1499988&ptid=128069][img]http://bbs.maxpda.com/images/common/back.gif[/img][/url]
webdup的几个页面都报木马!!!…… [/quote]
你是指网页有木马啊?我看了网站页面的源代码,有一些看似不正常的代码,但是我的金山没报木马。我直接给出链接吧
[url]http://www.webdup.com/gb/versions/Webdup093Beta.zip[/url]
下载了,把压缩包解压一下,再用卡巴杀杀看能不能查出什么来。
或者从附件下载,我把它贴到附件里吧

我一直用的金山毒霸。

PS:用OfflineExplorer也可以。但是我一般都用的国产免费的。

[attach]185421[/attach]

[[i] 本帖最后由 zhangjie203203 于 2008-5-3 21:30 编辑 [/i]]

2008-5-4 11:57 chy7719
谢谢,应该是网页里面的一些代码引起卡巴斯基的反应……

2008-5-4 17:23 hnzyxy
晕!我不学 了

2008-5-9 23:53 yanshoufeng
谢谢楼主转成TXT谢谢您.

2008-7-21 14:19 myberry
gooooooooooooooooooooooood

页: [1]


Powered by Discuz! Archiver 5.5.0  © 2001-2006 Comsenz Inc.