• 首页
  • 关于

我自然

每月存档:4月 2010

Ubuntu10.4 U盘安装

在 2010年4月28日 上公布 作者为 yankay

Ubuntu10.4明天就要发布了。俺的光驱虽然坏了,但是难掩跃跃欲试的激动。

于是在第一时间找到了支持在Windows下建立Ubuntu10.4自启动U盘方法。

UNetbootin:自启动U盘制作工具。网址http://unetbootin.sourceforge.net/

PS.这个Blog有更多关于Ubuntu U盘的信息,居家旅行,休闲必备。

文章分类 未分类 | 发表评论 |

TortoiseHg中文文件名乱码解决

在 2010年4月28日 上公布 作者为 yankay

基础知识

  • Mercurial(HG)是一个分布式的版本控制系统(VCS)之一。 和GIT类似。
  • HG内建Windows资源管理器前端TortoiseHg是 http://tortoisehg.bitbucket.org/ 可供下载。
  • TortoiseHg 0.8或更高版本,中文已经得到一定支持,可是文件名依旧会乱码。

乱码原因

  1. 在文件名“”可能被包括在内。
    • Windows使用“”分割路径,而Unix是“/”
  2. Windows和Linux环境与不同的编码环境
    • 这个就不必详述了

三种解决办法

win32mbcs
  • 可以解决路径分割符问题
hg-fixutf8
  • hg的python扩展
  • 支持命令行,也支持图形界面
  • 应用程序 网址:Http:/ / Mercurial.selenic.com/Wiki/Fixutf8Extension (英文)
Cygwin的Mercurial
  • Cygwin的1.7文件名处理为UTF – 8。基于这个原因,Cygwin的版本的Linux和Mercurial可用于互操作。然而,TortoiseHg和图形用户界面不可用。
比较表
字码 解决乱码 多个操作系统 图形用户界面
默认 GBK × × ○
win32mbcs GBK ○ × ○
hg-fixutf8 使用UTF – 8 ○ ○ ○
Cygwin 使用UTF – 8 ○ ○ ×

Fixutf8安装方法

  1. 运行 hg clone http://bitbucket.org/stefanrusek/hg-fixutf8。可以得到一个文件夹,
  2. 将这个文件夹拷贝到你想拷贝的地方。我拷贝在C:Program FilesTortoiseHghg-fixutf8
  3. 在C:Usersyankai (yankai是我的用户名)下有一个隐藏文件mercurial.ini,如果没有创建一个,在他后面添上
    [extensions]
    
    fixutf8 = C:Program FilesTortoiseHghg-fixutf8fixutf8.py

ok,乱码问题应该已经解决了。

文章分类 未分类 | 发表评论 |

HTML5中的微数据

在 2010年4月25日 上公布 作者为 yankay

缘起

HTML4,Html5,XHtml1,XHtml1.1,XHtml2….都是W3C的产品,乱乱的一团糟。有一篇漫画《标记语言之乱 ”xhtml2″vs“xhtml1”vs“html5”》,澄清了之间的关系。基本上是将XHtml2已死,天下是Html5和XHtml1的。

微数据

微格式是让网页通过语意相关让内容人机可读的一种方式。Wordpress里内置的XFN就可以算作一种微格式。那么什么是微数据呢?

HTML5提供了一种简易的方式将语义标签融入其中,这项功能就是微数据(Microdata)。根据W3c三月份的会议,微数据的存在就是为了填补微格式在应对类似Rdfa这种比较复杂的系统时的不足。

示例(Html5未完成,不保证和最终版本一致):

<section itemscope itemtype="http://example.org/animals#cat">
 <h1 itemprop="name http://example.com/fn">Hedral</h1>
 <p itemprop="desc">Hedral is a male american domestic
 shorthair, with a fluffy <span
 itemprop="http://example.com/color">black</span> fur with <span
 itemprop="http://example.com/color">white</span> paws and belly.</p>
 <img itemprop="img" src="hedral.jpeg" alt="" title="Hedral, age 18 months">
</section>

从上面这一段HTML可以得到如下信息:有一只猫,他:

Property Value
name Hedral
http://example.com/fn Hedral
desc Hedral is a male american domestic shorthair, with a fluffy black fur with white paws and belly.
http://example.com/color black
http://example.com/color white
img …/hedral.jpeg

你可以使用微格式的Dom模型来访问它:

var cats = document.getItems("http://example.com/feline");
var colors = cat.properties['http://example.com/color'].values;
var result;
if (colors.length == 0) {
  result = 'Color unknown.';
} else if (colors.length == 1) {
  result = 'Color: ' + colors[0];
} else {
  result = 'Colors:';
  for (var i = 0; i < colors.length; i += 1)
    result += ' ' + colors[i];
}

是不是很神奇?

你可以将使用itemtype=”http://microformats.org/profile/hcard”来描述名片信息,也可以用http://microformats.org /profile/hcalenda来描述日历。这样就不用另立标准,使用微格式的标准就可以了。

再谈谈RDFa。RDFa是一个W3C 推荐标准。它扩充了XHTML的几个属性, 网页制作者可以利用这些属性在网页中添加机械可读的元 数据。与RDF数据模型的对应关系使得 RDFa可以将RDF三体嵌入在XHTML文件中,它也使得符合标准的使用端可以从RDFa文件中萃取出这些RDF三体来。推荐一篇学习RDFa的文章, 《RDFa 入门》

事实上RDFa是为Xhtml2开发的,后来迁移到Xhtml1.0上,要想使用RDFa,则文档必须有XML的性质,这就麻烦了。将来非常流行的Html5不是XML,在非XML的 HTML里无法使用XML 命名空间。而Html5已经有比较完善的语义方法了,那么RDFa何去何从?

参见

http://edward.oconnor.cx/2009/05/microdata-microformats-and-rdf

http://www.w3.org/TR/rdfa-in-html/

http://www.w3.org/TR/2010/WD-rdfa-in-html-20100304/

http://www.w3.org/TR/2010/WD-rdfa-core-20100422/

http://www.w3.org/TR/2010/WD-html-markup-20100304/

http://www.w3.org/TR/2010/WD-xhtml-rdfa-20100422/

http://www.whatwg.org/specs/web-apps/current-work/multipage/microdata.html

Property Value
name Hedral
http://example.com/fn Hedral
desc Hedral is a male american domestic shorthair, with a fluffy black fur with white paws and belly.
http://example.com/color black
http://example.com/color white
img …/hedral.jpeg
文章分类 未分类 | 发表评论 |

在Linux下安装TortoiseHg

在 2010年4月22日 上公布 作者为 yankay

TortoiseHg 是一个跨平台的 Mercurial 分布式版本控制系统的可视化客户端工具。Mercurial 是一个跨平台的分布式版本控制软件,和Git一样。

有个图形界面感觉还是不错的。我的系统环境是Ubuntu。

#! /bin/bash
#添加tortoisehg和mercurial的源
sudo add-apt-repository ppa:tortoisehg-ppa/releases
sudo add-apt-repository ppa:mercurial-ppa/releases
sudo apt-get update
#安装tortoisehg和mercurial的源
sudo apt-get install mercurial python-nautilus tortoisehg
#集成nautilus
mkdir -p ~/.nautilus/tortoisehg/src/ && cd ~/.nautilus/tortoisehg/src/
hg clone https://bitbucket.org/tortoisehg/stable tortoisehg
mkdir -p ~/.nautilus/python-extensions/
ln -s ~/.nautilus/tortoisehg/src/tortoisehg/contrib/nautilus-thg.py ~/.nautilus/python-extensions/

重启就OK啦

文章分类 未分类 | 发表评论 |

Linux下很有潜力的输入法 ibus-sogoupycc

在 2010年4月19日 上公布 作者为 yankay

ibus-sogoupycc 一个非官方的搜狗云拼音客户端。

特点

  • 流畅的输入体验: 多线程请求,无需等待云服务器返回结果,也无需选词,输入无阻塞,前所未有的流畅的输入体验
  • 选词以及纠正模式: 可以选词,可加载多个词库,并对选定的不正确结果进行纠正
  • 支持双拼及简拼: 完整支持各种双拼方案,允许全拼下只输入声母,允许在双拼下使用全拼
  • 灵活的配置: 配置选项很多,涉及到输入法方方面面的细节,配置文件本身是脚本语言,可以非常灵活
  • 支持扩展: 支持扩展,几行代码就可能很实用
  • 离线使用: 即便网络条件不好或者没有网络,输入法也可以整合云服务器和本地词库,或者仅仅依据本地词库给出中文

使用起来很顺手,不过有时会假死,而且有时词语排序不大恰当。不过感觉很有潜力。

文章分类 未分类 | 发表评论 |

初见Giant Global Graph(巨大全球图)

在 2010年4月17日 上公布 作者为 yankay

以前花了很多的时间思考如何能完成语义,后来发现只是本体论的皮毛而已。不过同时也觉得语义网离我们实在是太遥远了 ,总不能所有的开发人员都学会了语义网才行吧,有这时间都能实现共产主义了。

最近,学习Neo4j,看到了一个PPT:

这篇PPT中提及了GGG,中文名为巨大全球图。

以下我写的对是巨大全球图的解释,不是很全,有什么不对,万望斧正。

巨大全球图 (或 GGG) ,是万维网的发明人Tim Berners-Lee在他的博客中提出了新概念.[1]

生物学家对药品,基因感兴趣。商人则是客户,产品,销售等等。而我们都会对朋友,家庭,同学感兴趣。你是否有这样的挫折感: 

你有一些朋友,Web提供了一些分开的服务,如微博,博客等等。有的在FaceBook,有的在LinkedIn,等等等等。当你加入了一个新的照片分享站点的时候,你需要告诉你所有的朋友来添加你为好友。网站都是分开的,内容也是分开的,虽然是同一个人,但系统很显然不知道,他们是一回事。总有一些公司试图包揽一切网络用户,提供统一的体验,但很显然没人能做到。

这是我和我的朋友的心声,有一个"Social Network Portability"社区,但社区网站对此并不感兴趣。网页上的链接是社会网络本身,而不只是网页上的链接。

Tim Berners-Lee认为类似于Facebook社交网站可以构成一个社交网络。他假定人们可以利用"图"来区分整个的网络。巨大全球图是比语义网来的更为贴切的称呼。

GGG提出了社交网络即语义网,虽然觉得有些牵强,不过也得到一些启发,就是社交网络包含有大量的语义信息,也许语义网可以率先在这个区域能实现。归结一下其语义有:

  • 个人资料,如姓名,邮箱,生日等等
  • 关系,包括Follow,被Follow,朋友,同一组织(包括虚拟组织)成员
  • 其文章,或状态等非结构化信息

如果能将Web上的社交网站信息加以整合,会达到什么效果呢?

  • 人肉。。。。
  • 人以类聚,物以群分。进行人物性格的挖掘,进行定点销售或广告,寻找潜在客户
  • 轻松找到所有小学同学的Email,并群发一条同学会的信息,或者加到一个QQ群中
  • 类似google follow finder。推荐好友
  • 不可告人的阴谋

微软有一个人立方的搜索引擎,以搜索资讯为主。根本无法用在普通人身上。

于是,一个名为FriendMap的项目即将幻化出现。他也是一个“人际关系搜索引擎”,但他关注的是普通人的关系和生活。能给一些应用,如校内,提供一些额外的信息支持,同时让普通的互联网用户对人际关系探寻中找到快乐。

文章分类 未分类 | 发表评论 |

近期文章

  • 听说 Docker 被 kubenetes 抛弃了,怎么办?containerd
  • 公告 – 博客重开了
  • CloudFoundry v2面面谈,内赠MicroCFv2福利
  • Docker能够运行任何应用的“PaaS”云
  • Scala Tour – 精选

近期评论

  • Gao发表在《公告 – 博客重开了》
  • Impala:新一代开源大数据分析引擎 – FIXBBS发表在《Google Dremel 原理 – 如何能3秒分析1PB》
  • 何建兵发表在《NoSQL数据库笔谈v0.2》
  • Pony发表在《Docker能够运行任何应用的“PaaS”云》
  • Pony发表在《Docker能够运行任何应用的“PaaS”云》

归档

  • 2021年6月
  • 2021年3月
  • 2014年2月
  • 2013年9月
  • 2013年5月
  • 2013年1月
  • 2012年11月
  • 2012年9月
  • 2012年8月
  • 2012年3月
  • 2012年2月
  • 2012年1月
  • 2011年11月
  • 2011年10月
  • 2011年9月
  • 2010年10月
  • 2010年8月
  • 2010年7月
  • 2010年6月
  • 2010年5月
  • 2010年4月
  • 2010年3月
  • 2010年2月
  • 2010年1月
  • 2009年10月
  • 2009年9月
  • 2009年8月
  • 2009年7月
  • 2009年6月
  • 2008年10月
  • 2008年8月
  • 2008年7月
  • 2008年6月

分类

  • 家庭生活
  • 未分类
  • 每日心得
  • 软件技术

友情链接

  • DaoCloud Enterprise
  • DaoCloud 云原生一体机

CyberChimps WordPress Themes

沪ICP备2021008917号-1 © 颜开