前些日子单位网站改版要求我将一个文学类子站转换一下后台,该子站由“翔宇”CMS系统生成,由于数据量不是很大,我便采用了简便的采集办法来转移数据,在转换过程中遭遇到UTF-8编码下的特殊空格问题,让我费了一番周折。
该子站页面内容为UTF-8编码,采集过来以后需要转换成GB2312编码,然后再写成静态文件。从设置采集规则到正式采集都非常顺利,页面内容被完整地抓取过来并存入数据库,不过内容中出现很多“问号”,这些“问号”就是UTF-8编码下的空格,如果不处理这些“问号”生成静态文件时会提示错误。我尝试用
1
| Replace(content,"?"," ") |
Replace(content,"?"," ")
来进行替换,发现替换不成功,可见转换后的“?”号不是普通的“ ”问号。我尝试用left函数单独取出这个字符,然后再转成ASCII码看看,发现的转换后的码值是“63”,而十进制的“63”不就是常规的“?”号吗?看来这个字符还不能进行ASCII转码,转换过就无法再还原回去了!
为了解决这个问题我查找了些资料,终于发现了问题的原因:在UTF-8编码里面存在一个特殊的字符,其编码是“0xC2 0xA0”,转换成字符的时候表现为一个半角空格,跟一般的半角空格(ASCII 0x20)不同的是它的宽度不会被压缩,所以排版中常能用到它。但是GB2312、Unicode之类并没有这样的字符,所以转换后会显示为“?”号,只是显示为问号而不是真正的问号,所以无法被替换! 阅读全文…
相信很多刚接触互联网的朋友,不知道该怎样寻找自己感兴趣的内容,总觉得上网就是聊QQ,就是玩游戏,时间长了就会觉得没啥意思!其实互联网并不是这样的,只是你没有学会使用它而已。下面无花果讲一些基本的查找资料的方法,使你在互联网上找到乐趣。
先说点闲话,什么是搜索引擎?简单地解释一下,互联网上的信息都是以网站形式发布的,网站有许许多多,每天所产生的信息也是不计其数的,这些信息我们无从知晓。这时出现这样一个大系统,它会每天都在互联网上自动搜索,并把找到的内容地址记录下来,我们只需要把需求告诉它,它就会把它找到的相关信息告诉我们,这种系统就是搜索引擎。
互联网早期的时候没有搜索引擎,想找内容基本上靠大家相传或者网址站链接,查找资料非常不方便。后来出来了“雅虎”才解决了这类问题。现在的搜索引擎很多,比较出名的有这么几个:
国外的:
Google也叫谷歌 网址是:www.google.com 国内网址是:g.cn
Yahoo也叫雅虎 网址是:www.yahoo.com.cn
Bing也叫必应 网址是:www.bing.com
国内的:
百度 网址是:www.baidu.com
这四个搜索引擎从技术水平和收录的内容量相比,雅虎和必应不是太老就是太新,不推荐大家使用;关于百度大家可能还记得“三鹿奶粉”事件吧?好像一夜之间在百度上就搜索不到了,什么原因咱就不说了!大家可以看看文章 “为什么我不用百度搜索 http://goo.gl/hvpF”或者“为什么要用GOOGLE搜索,不用百度搜索 http://goo.gl/hyCP” 这类文章很多,大家以后可以自己找找看。本文主要讲一下如何使用谷歌搜索引擎来找到我们想要的内容。

比方说我想看电影,如果你在谷歌搜索框中输入“我想看电影”这几个字,在结果中你翻了很多页也未必能找到在线提供电影的网站。这时你可以输入这样几个关键词 “电影 在线”,“电影”和“在线”之间空一格,意思是告诉搜索引擎,我要搜索“电影”或者“在线”或者“电影在线”又或是“在线电影”这两个词排列组合的相关内容,这是你就会发现搜索结果更多了,而且能够找到真实在线看电影的地方(像迅雷看看、优酷网、PPS 网络电视等等);或者搜索“免费 电影 在线”这样会得到很多免费在线看电影的信息。搜索是有技巧的,关于谷歌的技巧我总结了一下: 阅读全文…
您的电脑经常中木马、流氓插件吗?你在浏览网页的时候,浏览器经常失去响应吗?不要怀疑,这些基本上都和你的Internet Explorer浏览器有关系,由于该浏览器濒发漏洞导致网页木马肆意传播;由于该浏览器的Js代码执行效率低下或其它不名原因导致经常假死;您是不是已被它折腾得够呛?是不是想换换浏览器了?下面无花果向您推荐两款非常优秀的非IE内核浏览器。
首先推荐Firefox(火狐)浏览器,目前最新版本是3.6,您可以通过打开 http://www.mozillaonline.com/ 此页面下载到最新版。其中有专为国人定制的“火狐中国版”但不推荐您使用,具体原因下面会讲到。

先讲一下Firefox浏览器的特点:完全独立的内核,不受IE任何影响,浏览速度飞快;安全的防护体制,使您再也不会受到网页木马、流氓插件、恶意弹窗的影响;优秀的代理功能;隐私浏览功能,让浏览器不再缓存您的任何数据;丰富的插件,你需要的功能几乎都可以找到相关的插件等等。更多的特点需要您在使用中再慢慢地体会吧!
或许有人会说:我以前也试装过,使用起来很不习惯啊!鼠标手势也没有,界面也不漂亮。。。是的,您只安装了火狐而没装它的插件一定会是这样的感受!我刚开始时也是这样觉得的。为啥火狐不把这些插件集成起来呢?这也许就是国外软件和国内软件的不同之处吧?国内软件都喜欢把所有功能都加上,功能越多越好,而不管这些功能用户是否愿意用,就像QQ软件那样,结果是软件越来越大,运行起来越来越慢。裸火狐(我称没装插件的火狐为裸火狐)是很不好用,一个顺手的功能也没有。但是它不集成,因为它不知道用户到底需要怎样的功能,所有的功能都是以插件方式提供,你想用什么就装什么插件嘛,让用户自己选择。这样做软件也不会越来越庞大,只要保证你安装的插件不要太多,运行速度也不会受到多大的影响。比较一下,火狐这样做是不是更人性化一些? 阅读全文…

昨天看到的信息,说Google 的Gmail中要捆绑微博buzz,并预计周四发布,没想到今天就已经发布了,虽然我们简体中文的Gmail中还看不到buzz,但我们可以通过以下办法看到:
使用Firefox浏览器,安装User Agent Switcher扩展,重启Firefox后点菜单中的“工具” - “Default User Agent”,选中“iPhone 3.0”后再在标签中打开您的Gmail帐户,你会发现浏览器已经开始模拟手机方式工作了,邮箱顶部会出现buzz菜单项。需要注意一下的事,只有模拟iPhone 3.0才能看到。
试用中发现buzz的信息直接发送到邮箱中,造成微博信息和正常邮件混在一起,虽然微博信息前有buzz标签,但我觉得还是影响了邮件的正常浏览。据说可以在邮箱中设置过滤器,过滤掉微博信息,但我还没有开始尝试。Google这样做是不是合理?还有待于验证。
Gmail捆绑了微博,被屏蔽的机率就更大了,国内的朋友要注意了,重要的邮件及早备份下来吧!
Google推出buzz的时候准备的非常充分,API 接口也一同发布了,喜欢编程的朋友可以尝试一下,接口地址是:http://code.google.com/intl/zh-CN/apis/buzz/
后续:周四凌晨我的邮箱中终于见到buzz了,说一下如果设置过滤器来过滤buzz信息。点“收件箱”,看到搜索条右边有个“创建过滤器”的链接了吗?点它,在“包含字词”里输入“label:buzz”,主意不包括引号,再点下一步,勾选“跳过收件箱”即可完成!
如果你熟用RSS阅读器,请忽略本文!如果您使用浏览器,不停地切换网站来看内容,可以尝试RSS阅读方式,以提高阅读效率。
经常看到网站上有这样的图标:
或者是
还有的显示这样:
很多人都不知道这是做什么用的,下面我简单讲讲它的好处!
我们平时浏览新闻、论坛或者博客的时候,都要输入网址或者通过收藏夹打开,如果要看的网站比较多,各个网站之间来回切换是个比较麻烦的事情。有麻烦就会有解决办法,RSS就是为了解决这一“难题”而产生的。 阅读全文…