2013-04-25 39 views

mam już poGdzie jest 3-kierunkowy sterownik scalający Git dla plików .PO (gettext)?

[attr]POFILE merge=merge-po-files 

locale/*.po POFILE 

w .gitattributes i chciałbym uzyskać połączenia oddziałów pracować prawidłowo, gdy ten sam plik lokalizacja (np locale/en.po) została zmodyfikowana w oddziałach paraller. Obecnie używam następujące sterownik scalania:

# git merge driver for .PO files (gettext localizations) 
# Install: 
# git config merge.merge-po-files.driver "./bin/merge-po-files %A %O %B" 


# rename to bit more meaningful filenames to get better conflict results 
cp "${1}" "$LOCAL" 
cp "${2}" "$BASE" 
cp "${3}" "$REMOTE" 

# merge files and overwrite local file with the result 
msgcat "$LOCAL" "$BASE" "$REMOTE" -o "${1}" || exit 1 

# cleanup 
rm -f "$LOCAL" "$BASE" "$REMOTE" 

# check if merge has conflicts 
fgrep -q '#-#-#-#-#' "${1}" && exit 1 

# if we get here, merge is successful 
exit 0 

Jednak msgcat jest zbyt głupi i nie jest to prawdą trójdrożny scalić. Na przykład, jeśli mam

  1. wersja BASE

    msgid "foo" 
    msgstr "foo" 
  2. wersja LOCAL

    msgid "foo" 
    msgstr "bar" 
  3. wersji PILOT

    msgid "foo" 
    msgstr "foo" 

Skończy się konflikt. Jednak prawdziwym trójdrożny kierowca seryjnej będzie wyjście prawidłowe scalanie:

msgid "foo" 
msgstr "bar" 

pamiętać, że nie można po prostu dodać --use-first do msgcat ponieważ PILOT może zawierać zaktualizowane tłumaczenia. Ponadto, jeśli BASE, LOCAL i REMOTE są unikalne, nadal chcę konfliktu, ponieważ byłby to konflikt.

Co muszę zmienić, aby to działało? Dodatkowe punkty za mniej szalony znacznik konfliktu niż "# - # - # - # - #", jeśli to możliwe.


jakaś szansa, można użyć innego narzędzia Merge, jak KDiff3 (który jest 3-way)? – VonC


Czy próbowałeś rozwiązać konflikt pliku .PO scalania z kdiff3? Mam i nie jest ładna. Problem z plikami .PO polega na tym, że w rzeczywistości są to binarne pliki baz danych, które akurat wyglądają jak pliki tekstowe. Każde narzędzie zaprojektowane do scalania plików tekstowych zawiedzie. –



Czerpiąc inspirację z odpowiedzi Mikko, dodaliśmy pełnowartościowe trójstronne połączenie z klejnotem Ruby git-whistles.

To nie polega na git-merge lub przepisywania ciągu znaków w Perlu, a jedynie manipuluje plikami PO za pomocą narzędzi Gettext.

Oto kod (MIT licencjonowany):

# Three-way merge driver for PO files 
set -e 

# failure handler 
on_error() { 
    local parent_lineno="$1" 
    local message="$2" 
    local code="${3:-1}" 
    if [[ -n "$message" ]] ; then 
    echo "Error on or near line ${parent_lineno}: ${message}; exiting with status ${code}" 
    echo "Error on or near line ${parent_lineno}; exiting with status ${code}" 
    exit 255 
trap 'on_error ${LINENO}' ERR 

# given a file, find the path that matches its contents 
show_file() { 
    hash=`git hash-object "${1}"` 
    git ls-tree -r HEAD | fgrep "$hash" | cut -b54- 

# wraps msgmerge with default options 
function m_msgmerge() { 
    msgmerge --force-po --quiet --no-fuzzy-matching [email protected] 

# wraps msgcat with default options 
function m_msgcat() { 
    msgcat --force-po [email protected] 

# removes the "graveyard strings" from the input 
function strip_graveyard() { 
    sed -e '/^#~/d' 

# select messages with a conflict marker 
# pass -v to inverse selection 
function grep_conflicts() { 
    msggrep [email protected] --msgstr -F -e '#-#-#' - 

# select messages from $1 that are also in $2 but whose contents have changed 
function extract_changes() { 
    msgcat -o - $1 $2 \ 
    | grep_conflicts \ 
    | m_msgmerge -o - $1 - \ 
    | strip_graveyard 

TEMP=`mktemp /tmp/merge-po.XXXX` 

echo "Using custom PO merge driver (`show_file ${LOCAL}`; $TEMP)" 

# Extract the PO header from the current branch (top of file until first empty line) 
sed -e '/^$/q' < $LOCAL > ${TEMP}.header 

# clean input files 
msguniq --force-po -o ${TEMP}.base --unique ${BASE} 
msguniq --force-po -o ${TEMP}.local --unique ${LOCAL} 
msguniq --force-po -o ${TEMP}.remote --unique ${REMOTE} 

# messages changed on local 
extract_changes ${TEMP}.local ${TEMP}.base > ${TEMP}.local-changes 

# messages changed on remote 
extract_changes ${TEMP}.remote ${TEMP}.base > ${TEMP}.remote-changes 

# unchanged messages 
m_msgcat -o - ${TEMP}.base ${TEMP}.local ${TEMP}.remote \ 
    | grep_conflicts -v \ 
    > ${TEMP}.unchanged 

# messages changed on both local and remote (conflicts) 
m_msgcat -o - ${TEMP}.remote-changes ${TEMP}.local-changes \ 
    | grep_conflicts \ 
    > ${TEMP}.conflicts 

# messages changed on local, not on remote; and vice-versa 
m_msgcat -o ${TEMP}.local-only --unique ${TEMP}.local-changes ${TEMP}.conflicts 
m_msgcat -o ${TEMP}.remote-only --unique ${TEMP}.remote-changes ${TEMP}.conflicts 

# the big merge 
m_msgcat -o ${TEMP}.merge1 ${TEMP}.unchanged ${TEMP}.conflicts ${TEMP}.local-only ${TEMP}.remote-only 

# create a template to filter messages actually needed (those on local and remote) 
m_msgcat -o - ${TEMP}.local ${TEMP}.remote \ 
    | m_msgmerge -o ${TEMP}.merge2 ${TEMP}.merge1 - 

# final merge, adds saved header 
m_msgcat -o ${TEMP}.merge3 --use-first ${TEMP}.header ${TEMP}.merge2 

# produce output file (overwrites input LOCAL file) 
cat ${TEMP}.merge3 > $OUTPUT 

# check for conflicts 
if grep '#-#' $OUTPUT > /dev/null ; then 
    echo "Conflict(s) detected" 
    echo " between ${TEMP}.local and ${TEMP}.remote" 
    exit 1 
rm -f ${TEMP}* 
exit 0 

To nie było wystarczająco stabilne do mojego użytku. Zgadzam się, że jest to właściwy kierunek, ale w niektórych przypadkach połączenie nie powiedzie się. Nie mogę udostępnić przykładowego przypadku i obecnie nie mam czasu, aby utworzyć minimalny przypadek testowy. Spróbuję rozwiązać problem, gdy mam wystarczająco dużo czasu. Mój złożony sterownik poniżej jest w stanie pomyślnie połączyć, ale ten sterownik jest brzydkim hackerem. –


Oto przykładowy sterownik, który dokonuje poprawnego porównania tekstu ze znacznikami konfliktu we właściwych miejscach. Jednak w przypadku konfliktu, git mergetool z pewnością zepsuje wyniki, więc nie jest to zbyt dobre. Jeśli chcesz, aby rozwiązać konflikt scala używając tylko edytora tekstu, to powinno być dobrze:

# git merge driver for .PO files 
# Copyright (c) Mikko Rantalainen <[email protected]>, 2013 
# License: MIT 



# standardize the input files for regexping 
msgcat --no-wrap --strict --sort-output "${1}" > "$LOCAL" 
msgcat --no-wrap --strict --sort-output "${2}" > "$BASE" 
msgcat --no-wrap --strict --sort-output "${3}" > "$REMOTE" 

# convert each definition to single line presentation 
# extra fill is required to make sure that git separates each conflict 
perl -npe 'BEGIN {$/ = "#\n"}; s/#\n$/\n/s; s/#/##/sg; s/\n/#n/sg; s/#n$/\n/sg; s/#n$/\n/sg; $_.="#fill#\n" x 4' "$LOCAL" > "$LOCAL_ONELINE" 
perl -npe 'BEGIN {$/ = "#\n"}; s/#\n$/\n/s; s/#/##/sg; s/\n/#n/sg; s/#n$/\n/sg; s/#n$/\n/sg; $_.="#fill#\n" x 4' "$BASE" > "$BASE_ONELINE" 
perl -npe 'BEGIN {$/ = "#\n"}; s/#\n$/\n/s; s/#/##/sg; s/\n/#n/sg; s/#n$/\n/sg; s/#n$/\n/sg; $_.="#fill#\n" x 4' "$REMOTE" > "$REMOTE_ONELINE" 

# merge files using normal git merge machinery 
git merge-file -p -L "Current (working directory)" -L "Base (common ancestor)" -L "Incoming (another change)" "$LOCAL_ONELINE" "$BASE_ONELINE" "$REMOTE_ONELINE" > "$MERGED" 

# convert back to normal PO file representation 
cat "$MERGED" | grep -v '^#fill#$' | perl -npe 's/#n/\n/g; s/##/#/g' > "$OUTPUT" 

# git merge driver must overwrite the first parameter with output 
mv "$OUTPUT" "${1}" 

# cleanup 


# Steps to install this driver: 
# (1) Edit ".git/config" in your repository directory 
# (2) Add following section: 
# [merge "merge-po-files"] 
# name = merge po-files driver 
# driver = ./bin/merge-po-files %A %O %B 
# recursive = binary 
# or 
# git config merge.merge-po-files.driver "./bin/merge-po-files %A %O %B" 
# The file ".gitattributes" will point git to use this merge driver. 

Krótkie wyjaśnienie na temat tego sterownika: konwertuje regularne format pliku PO do formatu pojedynczej linii, gdzie każda linia jest wpisem tłumaczenie. Następnie używa zwykłego git merge-file do scalenia i po scaleniu wynikowy format pojedynczej linii jest konwertowany z powrotem do zwykłego formatu pliku PO. Ostrzeżenie: ten sterownik użyje msgcat --sort-output w pliku .PO, więc jeśli chcesz, aby twoje pliki PO były w określonej kolejności, może to nie być narzędzie dla ciebie.


Oto nieco skomplikowany przykładowy sterownik, który wydaje się wyprowadzać poprawne połączenie, które może zawierać niektóre tłumaczenia, które powinny zostać usunięte przez wersję lokalną lub zdalną.
Nic nie powinno zabraknąć, więc ten sterownik po prostu dodaje kilka dodatkowych zakłóceń w niektórych przypadkach.

Ta wersja używa lokalnego znacznika konfliktu o nazwie gettext, który wygląda jak #-#-#-#-# w połączeniu z flagą fuzzy zamiast zwykłych znaczników konfliktu git.
Kierowca jest nieco brzydki obejścia błędów (lub możliwości) w msgcat i msguniq:

# git merge driver for .PO files 
# Copyright (c) Mikko Rantalainen <[email protected]>, 2013 
# License: MIT 

ORIG_HASH=$(git hash-object "${1}") 
WORKFILE=$(git ls-tree -r HEAD | fgrep "$ORIG_HASH" | cut -b54-) 
echo "Using custom merge driver for $WORKFILE..." 





# standardize the input files for regexping 
# default to UTF-8 in case charset is still the placeholder "CHARSET" 
cat "${1}" | perl -npe 's!(^"Content-Type: text/plain; charset=)(CHARSET)(\\n"$)!$1UTF-8$3!' | msgcat --no-wrap --sort-output - > "$LOCAL" 
cat "${2}" | perl -npe 's!(^"Content-Type: text/plain; charset=)(CHARSET)(\\n"$)!$1UTF-8$3!' | msgcat --no-wrap --sort-output - > "$BASE" 
cat "${3}" | perl -npe 's!(^"Content-Type: text/plain; charset=)(CHARSET)(\\n"$)!$1UTF-8$3!' | msgcat --no-wrap --sort-output - > "$REMOTE" 

# convert each definition to single line presentation 
# extra fill is required to make sure that git separates each conflict 
perl -npe 'BEGIN {$/ = "\n\n"}; s/#\n$/\n/s; s/#/##/sg; s/\n/#n/sg; s/#n$/\n/sg; s/#n$/\n/sg; $_.="#fill#\n" x 4' "$LOCAL" > "$LOCAL_ONELINE" 
perl -npe 'BEGIN {$/ = "\n\n"}; s/#\n$/\n/s; s/#/##/sg; s/\n/#n/sg; s/#n$/\n/sg; s/#n$/\n/sg; $_.="#fill#\n" x 4' "$BASE" > "$BASE_ONELINE" 
perl -npe 'BEGIN {$/ = "\n\n"}; s/#\n$/\n/s; s/#/##/sg; s/\n/#n/sg; s/#n$/\n/sg; s/#n$/\n/sg; $_.="#fill#\n" x 4' "$REMOTE" > "$REMOTE_ONELINE" 

# merge files using normal git merge machinery 
git merge-file -p --union -L "Current (working directory)" -L "Base (common ancestor)" -L "Incoming (applied changeset)" "$LOCAL_ONELINE" "$BASE_ONELINE" "$REMOTE_ONELINE" > "$MERGED" 

# remove possibly duplicated headers (workaround msguniq bug http://comments.gmane.org/gmane.comp.gnu.gettext.bugs/96) 
cat "$MERGED" | perl -npe 'BEGIN {$/ = "\n\n"}; s/^([^\n]+#nmsgid ""#nmsgstr ""#n.*?\n)([^\n]+#nmsgid ""#nmsgstr ""#n.*?\n)+/$1/gs' > "$MERGED2" 

# remove lines that have totally empty msgstr 
# and convert back to normal PO file representation 
cat "$MERGED2" | grep -v '#nmsgstr ""$' | grep -v '^#fill#$' | perl -npe 's/#n/\n/g; s/##/#/g' > "$MERGED" 

# run the output through msguniq to merge conflicts gettext style 
# msguniq seems to have a bug that causes empty output if zero msgids 
# are found after the header. Expected output would be the header... 
# Workaround the bug by adding an empty obsolete fallback msgid 
# that will be automatically removed by msguniq 


#~ msgid "obsolete fallback" 
#~ msgstr "" 

cat "$MERGED" "$FALLBACK_OBSOLETE" | msguniq --no-wrap --sort-output > "$MERGED2" 

# create a hacked template from default merge between 3 versions 
# we do this to try to preserve original file ordering 
msgcat --use-first "$LOCAL" "$REMOTE" "$BASE" > "$TEMPLATE1" 
msghack --empty "$TEMPLATE1" > "$TEMPLATE2" 
msgmerge --silent --no-wrap --no-fuzzy-matching "$MERGED2" "$TEMPLATE2" > "$OUTPUT" 

# show some results to stdout 
if grep -q '#-#-#-#-#' "$OUTPUT" 
    FUZZY=$(cat "$OUTPUT" | msgattrib --only-fuzzy --no-obsolete --color | perl -npe 'BEGIN{ undef $/; }; s/^.*?msgid "".*?\n\n//s') 
    if test -n "$FUZZY" 
     echo "-------------------------------" 
     echo "Fuzzy translations after merge:" 
     echo "-------------------------------" 
     echo "$FUZZY" 
     echo "-------------------------------" 

# git merge driver must overwrite the first parameter with output 
mv "$OUTPUT" "${1}" 

# cleanup 

# return conflict if merge has conflicts according to msgcat/msguniq 
grep -q '#-#-#-#-#' "${1}" && exit 1 

# otherwise, return git merge status 

# Steps to install this driver: 
# (1) Edit ".git/config" in your repository directory 
# (2) Add following section: 
# [merge "merge-po-files"] 
# name = merge po-files driver 
# driver = ./bin/merge-po-files %A %O %B 
# recursive = binary 
# or 
# git config merge.merge-po-files.driver "./bin/merge-po-files %A %O %B" 
# The file ".gitattributes" will point git to use this merge driver. 

Krótkie wyjaśnienie o tym kierowcy:

  • konwertuje regularne format pliku PO do jednej linii format, w którym każda linia jest pozycją tłumaczenia.
  • Następnie używa zwykłego git merge-file --union do scalenia, a po scaleniu wynikowy format pojedynczej linii jest konwertowany z powrotem do zwykłego formatu pliku PO.
    Rzeczywista rozdzielczość konflikt odbywa się po to używając msguniq,
  • a potem wreszcie scala wynikowy plik z szablonem generowanym przez regularne msgcat łącząc oryginalne pliki wejściowe w celu przywrócenia ewentualnie utracone metadanych.

Ostrzeżenie: ten kierowca użyje msgcat --no-wrap plik .PO i wymusi kodowanie UTF-8 jeśli rzeczywisty kodowanie nie jest określony.
Jeśli chcesz użyć tego sterownika scalającego, ale zawsze sprawdzaj wyniki, zmień ostateczny exit $MERGESTATUS, aby wyglądał jak exit 1.

Po dostaniu się połączyć konflikt z tym sterownikiem, najlepsza metoda ustalania konfliktu jest, aby otworzyć plik w konflikcie z virtaal i wybierz Navigation: Incomplete.
Uważam, że ten interfejs jest całkiem dobrym narzędziem do naprawienia konfliktu.