自動分類pdf與shutil

這script主要是分類pdf用的,從謎之網站下載的 pdf 檔有規則,所以就可以寫code來自動分類。寫script時發現有shutil這個很方便的模組,可以用來複製、搬移檔案、目錄等,相當的方便,原本還以為要自己硬幹咧~
[python]#!/usr/bin/env python

– coding: utf-8 –

def main():
import glob
import os
import shutil
files = glob.glob( “*.pdf” )
for file_name in files:
parts = file_name.split(‘.’)
index = -2
while not parts[index].isdigit():
index = index + 1
dir_name = ” “.join(parts[:index])
if not os.path.exists(dir_name):
os.mkdir(dir_name)
try:
print(“Move ‘%s’ to ‘%s’.” % (
file_name, os.path.join(dir_name, file_name)))
shutil.move( file_name, os.path.join(dir_name, file_name))
except shutil.Error, e:
print(e)

if name == “main“:
main()
[/python]

電影流水帳(2010/9/8~2010/9/16)

好吧,找不到適合的圖來放,算了。好像又隔了太久,所以有點忘記自己看了什麼片了,從噗浪裡看來,應該是沒錯才對。

  • Date Night(IMDBWikipedia),中譯:約會喔麥尬。片商宣傳成喜劇片真是太可惜了,看完以後我倒是覺得這部片很溫馨。一對失去熱情,生活已經快要公式化的夫妻,各自都不想讓自己的婚姻生活邁向終點,於是都試圖做出改變,一切的笑點就在他們試圖做出改變的約會夜中爆出。在經過一晚的烏龍事件之後,他們兩人的用心最後都讓彼此感受到,所以來了個我覺得很溫馨的結局。總之夫妻生活久了,難免都會慢慢公式化,要怎麼過出新鮮感,真的是需要用心經營,這部電影的故事真的有打中我心裡的某個點,讓我有不少感觸。
  • 交響情人夢最終章前篇。當作日劇的濃縮版來看比較好,簡單說就是他們到了法國面對新的挑戰,千秋要馴服新的樂團,而野田妹則面對新的情敵與自己的未來,故事就這樣展開。看完以後只慶幸還好沒去電影院看,因為感覺上就是日劇的精簡版,下一部最終章應該才是主菜。

Yahoo Traffic Server

因為最近發現公司的 proxy 不理我 NB 上的 https request 了(我NB是走正常公司網路設定,也就是上網都會透過proxy),想到 COSCUP 2010 有介紹 Yahoo Traffic Server,想說架在另外一台不受限的機器上,讓 NB 透過這個 proxy 上網。
安裝不難,參考:Build instructions,三兩下就能 build 好,開發團隊好像就是在 Debian/Ubuntu 上開發的樣子,步驟寫的蠻仔細的。
設定倒是考倒我了,預設的設定是不 work 的。試了一陣,才找到這篇:Yahoo Traffic Server,裏面提到在 records.config 裡的兩個關鍵設定:

  • proxy.config.reverse_proxy.enabled
  • proxy.config.url_remap.remap_required

把這兩個設成 0,大致上就 ok 了。
我還有改到的設定:

  • records.config
    • proxy.config.cluster.ethernet_interface: 改 eth0
    • proxy.config.cache.ram_cache.size: 改 256M
  • storage.config: var/trafficserver 加大到 256M

事實上除了可以當類似 squid 的 proxy server 以外,也可以當 reverse proxy、Forward proxy(remap),同時也支援 cluster 架構、DNS cache…等,可以挖的功能相當多,以後有空再來挖好了。
其他可參考資料:Yahoo Traffic Server中文介紹以及for RHEL5 64bit/Gentoo 的 rpm檔

python 的 private method

純粹記錄一下,讓自己知道曾經犯過這個錯。類別裡的 method 名稱加上 __ 就是 private,所以,子類別並不會知道有這個 method,也不會發生 Method overriding

class Rectangle:
def __init__(self):
self.parse()
self.__parse()
def parse(self):
print("parse(): Rectangle")
def __parse(self):
print("__parse(): Rectangle")
class BoxType(Rectangle):
def parse(self):
print("parse(): BoxType")
# 不會被執行到!!
def __parse(self):
print("__parse(): BoxType")
b = BoxType()
# Output:
# parse(): BoxType
# __parse(): Rectangle

就這樣…

gtk.RecentChooserMenu

本來預期可以在 glade 裡就可以拉出這個元件,然後程式就不用寫,結果是不行。網路上範例不多,所以紀錄一下。
在 glade 裡,你要先預放一個 menuitem,假設命名為 mi_recent_items,你在程式裡就得先取出這個 menuitem,取得 RecentManager 然後建立 RecentChooserMenu,再用 mi_recent_items.set_submenu() 來設定。
RecentManager 是全系統的最近存取文件,這也是為什麼後續會要 RecentFilter 的原因,因為只要顯示需要的文件。當選取的時候,會觸發 item-activated 這個 signal。
代碼:

self.recent = gtk.RecentManager()
menu_recent = gtk.RecentChooserMenu(self.recent)
menu_recent.set_limit(10) # 設定要出現幾個
# 只取需要的檔案
self.file_filter = gtk.RecentFilter()
self.file_filter.add_pattern("*.pdb")
self.file_filter.add_pattern("*.updb")
menu_recent.set_filter(self.file_filter)
# 選取以後要做的事情
menu_recent.connect("item-activated", self.select_recent_cb)
# 取得在 glade 裡建立的 menuitem,然後用 set_submenu 設定。
menuitem_recent = self.builder.get_object("mi_recent_items")
menuitem_recent.set_submenu(menu_recent)

電影流水帳(2010/8/21~2010/9/7)

SALT

  • Salt(IMDB, Wikipedia),中譯:特務間諜。很適合Angelina Jolie的動作片,也難怪劇本會特別為她而修改。女主角的確就是諜中諜,不過到頭來,還是為了救她所愛的男人,把培養她的祖國間諜給幹掉了,同時也把潛伏在跟她同單位的諜中諜也解決掉,解除了核武危機。從片尾看起來,似乎還會有續集的樣子~
  • Hot Tub Time Machine(IMDB, Wikipedia),中譯:扭轉時光機。說到扭轉時光,應該就可以想見到故事會怎麼走了吧。這個故事其實也差不了多少,4個人現實生活的不如意,讓他們決定去度假,結果在浴缸裡喝個爛醉,不小心啟動了浴缸,讓他們回到70年代。為了避免改變未來,他們必須再做一次跟當年一樣的事情,但是並沒有完全一樣,最後4個人只有3個人回去,說起來,他們還是改變了未來,讓未來變得不一樣了。3個人回去以後,生活就變得如意了。我覺得不是很合理的設定,但算了,就當作喜劇片看看就好啦~
  • 一頁台北(IMDB, Wikipedia)。普普通通,坦白說,我覺得故事沒有拍出很好的fu,而且時間的設定上,好像有瑕疵,到底是一個晚上,還是多個晚上?捷運的路線設定好像也不太對。小凱的女友去了法國,這段期間,小凱認識了在書店工作的女孩Susie,Susie對他很有好感。遠距離導致了小凱跟霏霏的分手,小凱想挽回,所以去找了阿洪的老闆借錢要去法國,老闆答應小凱,但要小凱幫忙辦事情,陰錯陽差地小凱跟Susie被阿洪追著跑,幾乎跑遍了台北的南區,最後小凱還是去了法國,當然,這段感情是挽救不回來的了,回台北以後,跟Susie展開新戀情。我最喜歡最後的那個 slow motion跟跳舞的畫面,另外就是那個演阿洪的柯宇綸,他實在是蠻搶戲的。

python的class attribute

前兩天被這個東西給陰到了,只怪我沒搞清楚,這在 Learning python 2nd 裡的 21.1 裡寫的很清楚。不過我想,從Java/C++/C#跳槽過來的人應該都會搞糊塗吧~

以C++舉例,下面的code:
[cpp]class Object {
private:
int id;
};
[/cpp]

到了 python,應該都會很自然的寫成:
[python]# 例A
class Object:
id=0
[/python]

看起來沒錯,對吧~
不過,事實上,應該要寫成這樣才對:
[python]# 例 B
class Object:
def init(self):
self.id=0
[/python]

換句話說,例A翻譯成C++的話,其實是類似 static 的用法,也就是說,id 會變成一個共用的 static 變數:
[cpp]class Object {
private:
static int id;
};
[/cpp]

電影流水帳(2010/8/10~2010/8/20)

原來要登入 flickr 以後,才能點選”分享此項目”…
summers wars

  • サマーウォーズ(IMDB, Wikipedia),中譯:夏日大作戰。網路一片好評的動畫,相當不錯的片子。主角冒充學姊男友回鄉下要幫奶奶慶生,可是卻遇到學姊叔叔開發的病毒作亂,把當時的社交網路環境-OZ搞得亂七八糟,甚至連奶奶都因此而來不及急救而走了,於是他們為了復仇,聯手解決這個病毒,挽救了世界。OZ 的存在不知道是不是影射 i-Mode 或 Facebook,如果真的是如此,那真的是相當的驚悚。不過現在人慢慢也注意到隱私權的事情,所以未必會走向如此。還是回頭說動畫吧,這真的是相當好看的動畫。
  • Bride Wars(IMDB, Wikipedia),中譯:新年大作戰。青梅竹馬從小就期盼著當新娘的時刻,等到長大了,卻陰錯陽差,結婚的日期在同一天,為了搶有限的資源,就吵翻了天。導演把焦點放在兩個人的戰爭,卻把真正的重點輕描淡寫地帶過。我覺得故事本身是想說,戀愛十年功,卻往往在婚前破了功,婚前能齊心解決問題的,才算是闖過一起過日子的第1關。所以,這也是常常有人說,婚前應該要兩人一起去旅行,看看是否能共同一起生活,甚至一起面對困境。片子的最後,有一方跟男方分手,並且跟好友重歸舊好,之後,還跟好友的哥哥結了婚,是個皆大歡喜的結局。

busybox 的 mdev

mdev 實際上算是 udev 的替代品,代碼看起來很簡單。
下 mdev -s 會 enumerate /sys/class 下的檔案,並據此去建立 /dev 下的 device 檔案。如果 /etc 下有 mdev.conf,它會先參考這裡的設定,來決定 device 的 permission 與 user/group owner。
雖然說是 /sys/class,但是 /sys/class 下的檔案實際上都是 symbolic link,指向 /sys/device 下的檔案。
也可以下這行

echo /sbin/mdev > /proc/sys/kernel/hotplug

,直接讓 kernel detect 到新裝置時,就請 /sbin/mdev 去 /dev 建立新的 device 檔案。
kernel 是怎麼傳遞資訊給 mdev 的呢?答案是透過環境變數,kernel 在執行 /sbin/mdev 之前,會先填好 ACTION、DEVPATH跟SUBSYSTEM 這3個環境變數之後,再去呼叫,所以 mdev 才會知道要做些什麼。這也就是在 shell 下輸入 /sbin/mdev 會印出使用說明的原因,因為沒有這3個環境變數,mdev 就只印出說明了。
kernel mode 下的呼叫,還牽涉到 FIRMWARE 的部份,不過這邊目前沒用到,只有大致看一下。大底來說,就是如果有 FIRMWARE 環境變數時,他會試著去讀取 /lib/firmware/xxx 的 firmware 檔案內容,然後檢查 /sys/$dev/loading 這檔案,有了這檔案以後,再寫入 1,接著再把讀到的內容寫到 /sys/$dev/data 這個檔案裡去,完成載入外部 firmware 的動作。
程式相當的精簡,有空再來看看 udev。

pyexiv2 裡的 Rational 與 GPSCoordinate

要存GPS的相關tag到圖片時,因為某些tag要求存Rational或GPSCoordinate,我不知道該怎麼轉換,所以花了不少功夫查。我基本上是參考 這個老先生的code,他主要是使用 GPS tracker,所以會要讀取 tracker 裡的紀錄,然後以時間跟照片做比對,再把 GPS 位置寫進圖片裡。

可是遇到兩個問題:

  1. 他的 code 是用 surd 處理 Rational,我找不到 surd 了。
  2. 算出來的度、分、秒不準確。

首先是解決Rational問題,python 2.6 已經有內置的 module – Fraction 可以解決了。

def R(f):
"""R(float) - get a Rational number for a float"""
from fractions import Fraction
from pyexiv2 import Rational
r = Fraction.from_float( float(f) )
return Rational( r.numerator, r.denominator )

再來就是轉換的問題,從 Google gear 那邊拿到的經緯度,要轉換成度分秒,我後來是參考 上河文化網站-座標轉換程式與 Google Maps 地圖定位裡的 javascript 來改寫,這才得到正確的度、分、秒:

def d(angle):
"""d(any) - get degrees from a number :eg d(33.41) = 33"""
return math.floor(angle)
def m(angle):
"""m(any) - get minutes from a number :eg d(33.41) = 24"""
return math.floor( (angle-d(angle))*60 )
def s(angle):
"""s(any) - get seconds from a number :eg s(33.41) = 36"""
return round((angle-d(angle)-m(angle)/60)*3600)
def degree2coordinate( lat, lon ):
"""Convert degree to coordinate string."""
latR    = 'N'
lonR    = 'E'
if lat  < 0:
lat = -lat
latR= 'S'
if lon  < 0:
lon = -lon
lonR= 'W'
slat = "%03d,%02d,%02d%s" % (d(lat),m(lat),s(lat),latR )
slon = "%03d,%02d,%02d%s" % (d(lon),m(lon),s(lon),lonR )
return (pyexiv2.GPSCoordinate.from_string( slat ), pyexiv2.GPSCoordinate.from_string( slon ) )

最後,記一下,Tag裡要存的資料型態:

  • Xmp.exif.GPSLatitude、Xmp.exif.GPSLongitude 裡存的是 pyexiv2.GPSCoordinate
  • Xmp.exif.GPSMapDatum、Exif.GPSInfo.GPSMapDatum裡存的是字串,我是用 WGS-84
  • Exif.GPSInfo.GPSLatitude、Exif.GPSInfo.GPSLongitude 裡存的是度、分、秒的tuple,要注意,度、分、秒都要轉成 Rational
  • Exif.GPSInfo.GPSLatitudeRef、Exif.GPSInfo.GPSLongitudeRef 裡存的是度、分、秒的表示字串,如:125.3,67.5,12E