XML, HTML, MD veya anahtar-değer yapısı olmayan diğer kaynak dosyaları her yüklediğinizde, otomatik içerik bölümleme için ön tanımlı bölümleme kuralları (SRX 2.0) kullanılır. Bununla birlikte, varsayılan bölümleme kurallarının kaynak dosyaları istenen beklentilerin aksine bölümlere ayırdığı durumlar olabilir. Bu durumda, SRX 2.0 standardını kullanarak her kaynak dosyası için tek tek ayrı kendi bölümleme kurallarınızı tanımlayabilirsiniz.
İçerik > Dosyalar’da bölümlemeyi değiştirebilirsiniz.
Yeni bölümleme kurallarınızı kaydetmenizden sonra, kaynak dosyanız otomatik olarak yeniden içe aktarılacak ve bu yeni kurallara göre bölümlenecektir.
Tipik bir SRX dosyası aşağıdakine benzer:
<?xml version="1.0" encoding="UTF-8"?>
<srx version="2.0"
xmlns="http://www.lisa.org/srx20"
xsi:schemaLocation="http://www.lisa.org/srx20 srx20.xsd"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<header segmentsubflows="yes" cascade="yes">
<formathandle type="start" include="no"/>
<formathandle type="end" include="yes"/>
<formathandle type="isolated" include="yes"/>
</header>
<body>
<languagerules>
<languagerule languagerulename="Default">
<!-- Common rules for most languages -->
<rule break="no">
<beforebreak>^\s*[0-9]+\.</beforebreak>
<afterbreak>\s</afterbreak>
</rule>
<rule break="yes">
<afterbreak>\n</afterbreak>
</rule>
<rule break="yes">
<beforebreak>[\.\?!]+</beforebreak>
<afterbreak>\s</afterbreak>
</rule>
</languagerule>
</languagerules>
<maprules>
<!-- List exceptions first -->
<languagemap languagepattern="[Ee][Nn].*" languagerulename="English"/>
<languagemap languagepattern="[Ff][Rr].*" languagerulename="French"/>
<!-- Japanese breaking rules -->
<languagemap languagepattern="[Jj][Aa].*" languagerulename="Japanese"/>
<!-- Common breaking rules -->
<languagemap languagepattern=".*" languagerulename="Default"/>
</maprules>
</body>
</srx>
Genellikle, nokta işareti bir cümle ayırıcısı olarak kullanılır. Bununla birlikte, bazı Asya dilleri için durum böyle değildir. Örneğin, Çincedeki tipik cümle ayırıcı ideografik bir nokta işaretidir (。
). Bu gibi durumlarda, aşağıdaki kural grubunu kullanmak isteyebilirsiniz:
<rule break="yes">
<beforebreak>[\x3002]+</beforebreak>
<afterbreak></afterbreak>
</rule>
Aşağıdaki basit cümlede, bir metin parçasını iki (veya daha fazla) dizgiye bölmenin gerekli olduğu bir durumda ayıracağız.
Varsayılan bölümleme kurallarına sahip metin:
Bu örnek cümlenin birinci kısmı ve bu ikinci kısmıdır.
Yeni bölümleme kurallarına sahip metin:
Bu örnek cümlenin birinci kısmı
ve bu ikinci kısmıdır.
Bu özel durum için aşağıdaki kural grubu, ilk cümleyi iki bölüme ayıracaktır:
<rule break="yes">
<beforebreak>kısmı</beforebreak>
<afterbreak>\u0020</afterbreak>
</rule>
SRX bölümleme kuralları, Ratel gibi araçlar yardımıyla oluşturulabilir ve sürdürülebilir. Bölümleme kurallarını sıfırdan oluşturabileceğiniz veya varolanlarınızı düzenleyebileceğiniz görsel bir arayüze sahiptir.
Özel bölümleme kurallarınızı ayarlama konusunda yardıma mı ihtiyacınız var ya da herhangi bir sorunuz mu var? Destek Ekibine Ulaşın.