伪原创和原创的思想解放

  这里是牢骚:今天或许未来几天的主要一个话题,可能就是sogou的那点事情了。和360相比的话,我会更看好搜狗。理由不用多说,金山毒霸从被360压着打到起码平分秋色,搜狗很大程度就是一样的翻版。不过搜狗的域名真的很纠结,sogou和sougou,太接近了。结果差别实在太大。搜狗不差钱的话,就把sougou收了吧。

  目前,sougou是搜狗®宠物天下 京ICP证070341号 京ICP备12021655号 电信业务审批[2007]字第342号函 单位编号:1101082000,“搜狗”、“SouGou”是SouGou.com的注册商标。Newpower.com 旗下网站。没具体去查域名信息,表面看看,应该是两个主体。以下是正文:

Read More

P2P式的开源搜索引擎面世了

  这是一篇来自36氪的信息,一个名叫YaCy的项目要在搜索市场上向Google叫板,放出了一个开源搜索引擎,在互联网和内联网皆可使用。YaCy引擎基于点对点连接,而不是通过中央服务器进行搜索查询。用户下载该软件后就可以进行搜索,保证内容不被审查、搜索结果不会被中央服务器记录和分析。

  “我们在网络上的大多数行为都和搜索有关,这是我们和所要信息的关键一环。对于这样一个至关重要的功能,我们不能仅依赖于几家大公司,并在过程当中让步我们的隐私。”YaCy项目领袖Michael Christen在一份声明中说道。“

Read More

如何向搜索引擎递交sitemap

  Sitemap是一个xml格式的文件,提供url方便搜索引擎抓取网站的网页,是SEO(搜索引擎优化)的基础工作。最近在优化公司的英文网站,这里收集整理了一些搜索引擎的sitemap提交地址。

  1、腾讯搜搜http://open.soso.com/sitemap/

  搜搜开放平台提供了提交sitemap的功能。

Read More

头号王菲很危险

点进去,其实是来自搜狐的新闻。说明下,虽然是腾讯的新闻邮件订阅,但是腾讯送上的新闻并不全来源于腾讯的站点。结果就是不能打开。这一不能打开,我就好奇就来了,啥花边新闻这么敏感被删除了呀。就赶快狗一下了。结果如下图,你看到这么个结果,我好奇更大了。

 

 

Read More

月光博客的转型

月光博客已经不是williamlong一个人在那里唠唠叨叨的了,从月光博客接受投稿以来,近来的文章发表已经不少都是投稿的贡献了。改变是为了适应生存。当年博客或者说独立博客正是人们新鲜的时候,月光站在了小众的前面,可以说吸引了几乎大半的独立博客的关注。当然也无心插柳的成就了ZBLOG。这么几年下来,月光博客的读者群只怕已经开始陆续的离开了。月光博客当初赖以依赖的大环境不得不说在悄然的改变。对此略有感想:

1、曾经的稍有名气的独立bloger都开始减慢更新了,比如:keso、awflasher等。和当年的高产出相比,已经是在苟延残喘了。而时间久点的独立博客也开始画地为牢的小区域化了。有自己的小天地。少量固定的读者。比如:煎蛋花果山寨等。看这类博客的人大多不会去关注月光博客。而独立博客的人在减少,使用ASP博客的人在减少的情况下,月光博客的IP数量只怕肯定会缩减的。

Read More

转:中文搜索引擎提交入口(09年更新)

1、Google提交
http://www.google.com/addurl/?hl=zh_CN

2、百度提交
http://www.baidu.com/search/url_submit.html

3、Bing提交
http://cn.bing.com/docs/submit.aspx

4、有道提交
http://tellbot.youdao.com/report

Read More

如何写robots.txt

网上随便看看,看到这篇文章,本来对于是不是要robots.txt没想那么多,不过先来看看,这个作者怎么写吧,他写了一个自己的robots.txt还附带了月光博客的robots.txt。

这个是作者自己的:(Disallow代表禁止抓取)

User-agent:*
#Directories(目录)
Disallow:/ADMIN/ //后台管理文件
Disallow:/SCRIPT/ //调用的SCRIPT文件,即使搜索引擎抓到了,也不读取
Disallow:/PLUGIN/ //插件目录
Disallow:/FUNCTION/ //不需抓取
Disallow:/DATA/ //数据库目录
Disallow:/CACHE/ //Zblog生成静态页的缓存目录,和正常文章基本一致,高重复
Disallow:/TEMPLATE/ //模板目录
Disallow:/CSS/ //CSS的一些调用文件目录
Disallow:/LANGUAGE/ //语言目录,不必抓取
#Files(文件)
Disallow:/login.asp //登录后台文件
Disallow:/cmd.asp? //这个是供别人引用通知时产生的页面
Disallow:/search.asp //搜索页,无人使用的时候,就是一个空页
Disallow:/atom.xml //支持ATOM的FEED页,高重复。
Disallow:/rss.xml //支持RSS的FEED页,高重复。
Disallow:/view.asp? //后台预览文章时生成的页面

Read More