31 Temmuz 2016 Pazar

LibreOffice "headless" Modunda Dosyaları Dönüştürme

 

LibreOffice yazılımı komut satırından başlatarak, çeşitli parametreler atayabilirsiniz. Normal biçimde kullanımlarda, komut satırı parametrelerinin kullanımı gerekli değildir. Genellikle deneyimli kullanıcıların tercihidir.

UNIX-benzeri sistemlerde, LibreOffice yazılımını komut satırından başlatmak için aşağıdaki satır yazılır : 

${install}/program/soffice {parametre}}

Buradaki {install} ifadesini LibreOffice yazılımının kuruluş yoluyla değiştirin (örneğin, ~/office)

{parametre} ifadesi gerektiğinde geçerli komut satırı parametrelerinden biri yazılarak kullanılabiliyor. İşte bu parametrelerden biri olan "--headless" uygulamayı kullanıcı arayüzsüz kullanmanızı sağlar.

Diğer parametrelerden biri olan "--convert-to" ise dosyaları yığın olarak dönüştürebiliyor.

**Bu iki parametre birlikte kullandığında ise komut satırında, desteklenen tüm dosya formatlarını yığın olarak dönüştürebiliyor. 

Bunun için temel komut şudur;

soffice                                                             \
   -env:UserInstallation=file:///tmp/LibreOfficeConversion_${USER}" \
   --headless                                                       \
   --infilter=<filter>                                              \
   --convert-to <TargetFileExtension>:<NameOfFilter>                \
   --outdir /path/to/wherever/you/want                              \
     file_to_convert.xxx


-env:UserInstallation : bu parametre zaten potansiyel olarak çalışan bir GUI varsa çakışmasını engelleyecek ve farklı bir ortam kullanıp ek bir örnek sağlayacaktır.

<TargetFileExtension>  : Libreoffice tarafından desteklenen ve dışa aktarılabilen dosya formatları yazılabilir. Örneğin 'pdf', 'docx', 'xlsx'

<NameOfFilter>  : Önceki hedef dosya uzantısı yanı sıra girdi biçimi eşleşmelidir. Örneğin 'calc_pdf_Export', 'writer_pdf_Export'. Filtrelerin listesi şurada.

--infilter=<filter>  : parametresi isteğe bağlı olarak kullanılabilir. Eğer mümkünse girdi filtre türünü zorlar. Örneğin infilter="Calc Office Open XML"

  *.xcu dosyalarında ki girdi filtre isimleri şurada (API isimleri).  Örneğin MS_EXCEL_95.xcu dosyası şu satırı içerir :
                       
                    <node oor:name="MS Excel 95" oor:op="replace">


 
 

12 Temmuz 2016 Salı

.docx ve .odt nedir ?

 

   

 

.docx nedir?


 docx, Microsoft‘un Windows işletim sistemleri içerisinde yer verdiği Word yazılımının yeni nesil dosya uzantısıdır. Microsoft Word 2007 sürümüne kadar Word dosyalarının uzantıları “.doc” şeklinde kayıt edilirken Word’ün 2007 sürümü ve sonrasında kullanılan Word sürümlerinde dosya formatı “.docx” olarak oluşturulmaktadır.

 Belge verilerini tek bir binary dosyasında depolayan .doc dosyalarının aksine, .docx dosyaları Open XML formatı kullanarak oluşturulur, bu format da belgeleri sıkıştırılmış bir zip paketinde ayrı dosyalar ve klasörler olarak depolar.

 Bir .docx dosyasının içinde XML dosyaları ve üç klasör bulunur (docProps , word , ve _rels). Bu klasörler, belge özelliklerini, içeriğini ve dosyalar arasındaki ilişkileri tutar. Bu yapı, belgenin içeriğinin daha fazla erişilebilir olması için tasarlanmıştır.



 DOCX dosyasını açmak için bilgisayarınızda Microsoft Word 2007 veya daha sonraki sürümlerinin bulunması gerekiyor. Eğer bu sürümlerden daha önce yayınlanmış bir Word sürümü kullanıyorsanız DOCX dosyalarını açabilmek ve oluşturabilmek için Microsoft tarafından yayınlanmış olan uyumluluk paketini kurmanız gerekiyor.

 LibreOffice ve OpenOffice başta olmak üzere diğer ofis yazılımlarıyla veya DocX Viewer benzeri yazılımlarla da docx dosyalarını açabilirsiniz.




  .odt nedir? (Open Document Text)


 odt, LibreOffice Writer ve Google Belgeler gibi kelime işlem uygulamaları tarafından kullanılan dosya uzantısıdır.

 OpenDocument ya da tam adıyla OASIS OpenDocument XML biçimi, sayısal ortamda metin, hesap tablosu, çizim ve sunu gibi belgelerinizi saklamaya yarayan bir açık ve özgür belge standardıdır.

 İlk sürümü 3 Mayıs 2006 tarihinde kabul edilen OpenDocument biçimi, çok sayıda kelime işlemci ve ofis yazılımı tarafından desteklenmektedir. Bu belge biçimi LibreOffice, Apache OpenOffice, Calligra, Google Dokümanlar arayüzü, StarOffice ve Lotus Notes ürünleri tarafından da kullanılmaktadır.

 OpenOffice.org 2.0'dan itibaren tüm OpenOffice.org bileşenleri (Writer, Calc, Impress, vb) standart OASIS OpenDocument XML biçimini kullanmaya başladı. Bu sayede üreticiden bağımsız bir şekilde hazırlanan belgeler, herhangi bir editör yardımıyla açılıp incelenebilmektedir.

  Aslında birer XML belgeleri olan OpenDocument dosyaları, kayıpsız ZIP sıkıştırma algoritmasını desteklemektedir. Bir .odt dosyasının içinde XML dosyaları, diğer dosyalar(mimetype) ve iki dizin bulunur (META-INF, Thumbnails).


 *content.xml
   En önemli dosyadır. Belgenin gerçek içeriğini taşır. Temel HTML biçiminde esinlenilmiştir. İçeriği şöyledir:



*styles.xml
  Stil bilgilerini içerir. OpenDocument, biçimlendirme ve düzen için stilleri yoğun kullanır. Stillerin türleri vardır.
  • Paragraph styles
  • Page styles
  • Character styles
  • Frame styles
  • List styles

*meta.xml
    metadata dosya verilerini içerir. Örneğin; Author, "Last modified by", date of last modification. <dc:...> tagının ismi Dublin Core XML standarttan gelir. İçeriği şuna benzer:


*settings.xml
  Yakınlaştırma faktörü ve imleç konumu gibi ayarları içerir. Bunlar içerik veya düzen olmayan özelliklerdir. 

*mimetype (file)
  Belgenin tek satırlık dosyasıdır. Aslında bu dosya uzantısı biçiminin önemsiz olduğunun bir göstergesidir.. Dosya uzantısı orada sadece kullanıcı yararına bulunur.

*Thumbnails (directory)
  Küçük resim için ayrı bir dizindir. Küçük resmin, “thumbnail.png” olarak kaydedilmiş olması gerekir. Dosya kaydedildiğinde, belgenin küçük resim gösterimi varsayılan olarak oluşturulur.

  Belgenin temsili ilk sayfa, ilk tablo vs. olmalıdır. Küçük resimler için gerekli büyüklük 128x128 pixel'dir. Thumbnail Managing Standard (TMS) ına uygunluk sağlamak amacıyla, küçük resmin 8bit olarak kaydedilmiş olması gerekir.

*META-INF (directory)
  OpenDocument pakette yer alan dosyalar hakkında "manifest" adında bir XML dosyası saklanır. Manifest dosyası her zaman "META-INF/manifest.xml" yol adında depolanır. Manifestte saklanan bilgilerin ana parçaları:
  • Paketin içindeki tüm dosyaların bir listesi
  • Paketteki her dosyanın media tipi
  • Eğer paketin içinde saklanan bir dosya şifreli ise, dosyanın şifresini çözmek için gerekli bilgileri saklanır.

*Pictures (directory)
  Belgedeki görüntüler için ayrı bir dizin vardır. Bu dizin OpenDocument belirtimi içinde tanımlı değildir. Bu dizindeki eklenen dosyanın formatına göre, görüntü biçimlerini kullanabilirsiniz. Görüntü verileri rasgele bir biçime sahip olmakla birlikte, SVG ve PNG formatında saklanması tavsiye edilir.