import os
import pdb
import string
import linecache
import codecs #unicode

#file descriptor za IN i OUT datoteku
dat_in=codecs.open("EH.txt",'r',encoding='cp1250')
otv_dat_in=dat_in.read()
dat_out=open("cro-dict.txt","w+")

# citaj line by line
br_lin=otv_dat_in.count("\n")
c=1
prijevod2=""
prijevod_sum=""
#pdb.set_trace()
otv_dat_out=dat_out.writelines("<body><html>")
while c <= br_lin:	
	t=linecache.getline("EH.txt",c)
	t2=linecache.getline("EH.txt",c+1)
		
	nadji_rijec=t.find('\t') 
	rijec = t[:nadji_rijec]
	
	nadji_prijevod=t.rfind('\t')
	nadji_prijevod += 1#bez toga prijevod ima TAB na pocetku
	prijevod=t[nadji_prijevod:]#izreze sve od taba	
	prijevod_sum=prijevod+";"+prijevod_sum
	nadji_rijec2=t2.find('\t') 
	rijec2 = t2[:nadji_rijec2]
	
	rijec=str(rijec)
	rijec=rijec.strip()
	rijec2=str(rijec2)
	rijec2=rijec2.strip()

	if rijec!=rijec2:
		if prijevod_sum=="":
			prijevod_sum=prijevod
		#prijevod_sum=prijevod_sum+prijevod
		zapis="<idx:entry><idx:orth><b>"+str(rijec)+"</b></idx:orth><br/>"+str(prijevod_sum)+"</idx:entry><mbp:pagebreak/>"+'\n'
		otv_dat_out=dat_out.writelines(zapis)	
		#print rijec,prijevod_sum
		#print prijevod
		prijevod2=""
		prijevod=""
		prijevod_sum=""
		c+=1
	
	elif rijec==rijec2:
		c+=1

otv_dat_out=dat_out.writelines("</body></html>")
dat_in.close()
dat_out.close()
