#!/usr/bin/python3
#
# Copyright (c) 2016, Intel Corporation.
#
# This program is free software; you can redistribute it and/or modify it
# under the terms and conditions of the GNU General Public License,
# version 2, as published by the Free Software Foundation.
#
# This program is distributed in the hope it will be useful, but WITHOUT
# ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
# FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
# more details.
#
import argparse
import csv
import json
import locale
import logging
import os
import re
import shutil
import sys
import tempfile
import time
import xml.etree.ElementTree as ET
from collections import defaultdict, OrderedDict, MutableMapping
from datetime import datetime, timedelta, tzinfo
from glob import glob
from subprocess import check_output, CalledProcessError
from xml.dom import minidom

# Import oe libs
scripts_path = os.path.dirname(os.path.realpath(__file__))
sys.path.append(os.path.join(scripts_path, '../lib'))
import scriptpath
scriptpath.add_oe_lib_path()

from oeqa.utils.git import GitRepo, GitError


# Setup logging
logging.basicConfig(level=logging.INFO, format='%(levelname)s: %(message)s',
                    stream=sys.stdout)
log = logging.getLogger()

TEST_STATUSES = ('SUCCESS', 'FAILURE', 'ERROR', 'SKIPPED', 'EXPECTED_FAILURE',
                 'UNEXPECTED_SUCCESS')

BS_RUSAGE_FIELDS = ('ru_utime', 'ru_stime', 'ru_maxrss', 'ru_minflt',
                    'ru_majflt', 'ru_inblock', 'ru_oublock', 'ru_nvcsw',
                    'ru_nivcsw')
BS_IOSTAT_FIELDS = ('rchar', 'wchar', 'syscr', 'syscw', 'read_bytes',
                     'write_bytes', 'cancelled_write_bytes')


class CommitError(Exception):
    """Script's internal error handling"""
    pass

class ConversionError(Exception):
    """Error in converting results"""
    pass


class ResultsJsonEncoder(json.JSONEncoder):
    """Extended encoder for build perf test results"""
    unix_epoch = datetime.utcfromtimestamp(0)

    def default(self, obj):
        """Encoder for our types"""
        if isinstance(obj, datetime):
            # NOTE: we assume that all timestamps are in UTC time
            return (obj - self.unix_epoch).total_seconds()
        if isinstance(obj, timedelta):
            return obj.total_seconds()
        return json.JSONEncoder.default(self, obj)


class TimeZone(tzinfo):
    """Simple fixed-offset tzinfo"""
    def __init__(self, seconds, name):
        self._offset = timedelta(seconds=seconds)
        self._name = name

    def utcoffset(self, dt):
        return self._offset

    def tzname(self, dt):
        return self._name

    def dst(self, dt):
        return None

TIMEZONES = {'UTC': TimeZone(0, 'UTC'),
             'CST': TimeZone(-21600, 'CST'),
             'CDT': TimeZone(-18000, 'CDT'),
             'EDT': TimeZone(-18000, 'EDT'),
             'EST': TimeZone(-14400, 'EST'),
             'ET': TimeZone(-14400, 'ET'),
             'EET': TimeZone(7200, 'EET'),
             'EEST': TimeZone(10800, 'EEST')}


class OutputLogRecord(object):
    """Class representing one row in the log"""
    def __init__(self, timestamp, msg):
        self.time = timestamp
        self.msg = msg

    def __str__(self):
        return "[{}] {}".format(self.time.isoformat(), self.msg)

class OutputLog(object):
    """Class representing the 'old style' main output log"""
    def __init__(self, filepath):
        self.new_fmt = False
        self.records = []
        self._start = None
        self._head = None
        self._end = None
        self._read(filepath)

    @staticmethod
    def _parse_line_old_default(line):
        """Parse "old" style line in C locale"""
        split = line.split(None, 6)
        try:
            timestamp = datetime.strptime(' '.join(split[0:4] + split[5:6]),
                                          '%a %b %d %H:%M:%S %Y:')
        except ValueError:
            raise ConversionError("Unable to parse RO timestamp")
        timezone = TIMEZONES[split[4]]
        return timestamp, timezone, split[6].strip()

    @staticmethod
    def _parse_line_old_ro(line):
        """Parse "old" style line in RO locale"""
        split = line.split(None, 6)
        try:
            timestamp = datetime.strptime(' '.join(split[0:5]), '%A %d %B %Y, %H:%M:%S')
        except ValueError:
            raise ConversionError("Unable to parse RO timestamp")
        hhmm = split[5]
        offset = int(hhmm[0] + '1') * (int(hhmm[1:3])*3600 + int(hhmm[3:5])*60)
        timezone = TimeZone(offset, hhmm)
        return timestamp, timezone, split[6].strip()

    def _read(self, filepath):
        """Read 'old style' output.log"""

        orig_locale = locale.getlocale()
        fobj = open(filepath)
        try:
            # Check if the log is from the old shell-based or new Python script
            if fobj.read(1) == '[':
                self.new_fmt = True
            else:
                # Determine timestamp format
                fobj.seek(0)
                line = fobj.readline()
                locales = (('C', self._parse_line_old_default),
                           ('es_MX.UTF-8', self._parse_line_old_default),
                           ('ro_RO.UTF-8', self._parse_line_old_ro))
                for loc, parse_line in locales:
                    try:
                        locale.setlocale(locale.LC_ALL, loc)
                        parse_line(line)
                        break
                    except ConversionError:
                        pass
                if not parse_line:
                    raise ConversionError("Unable to parse output.log timestamps")
            fobj.seek(0)

            for line in fobj.readlines():
                if self.new_fmt:
                    split = line.split(']', 1)
                    try:
                        timestamp = datetime.strptime(split[0],
                                                      '[%Y-%m-%d %H:%M:%S,%f')
                    except ValueError:
                        # Seems to be multi-line record, append to last msg
                        self.records[-1].msg += '\n' + line.rstrip()
                    else:
                        self.records.append(OutputLogRecord(timestamp,
                                                            split[1].strip()))
                else:
                    timestamp, timezone, message = parse_line(line)
                    # Convert timestamps to UTC time
                    timestamp = timestamp - timezone.utcoffset(timestamp)
                    #timestamp = timestamp.replace(tzinfo=TIMEZONES['UTC'])
                    timestamp = timestamp.replace(tzinfo=None)
                    self.records.append(OutputLogRecord(timestamp, message))
        finally:
            fobj.close()
            locale.setlocale(locale.LC_ALL, orig_locale)

    def _find(self, regex, start=0, end=None):
        """Find record matching regex"""
        if end is None:
            end = len(self.records)
        re_c = re.compile(regex)
        for i in range(start, end):
            if re_c.match(self.records[i].msg):
                return i
        raise ConversionError("No match for regex '{}' in output.log between "
                              "lines {} and {}".format(regex, start+1, end+1))

    def set_start(self, regex):
        """Set test start point in log"""
        i = self._find(regex)
        self._start = self._head = i
        self._end = None
        return self.records[i]

    def set_end(self, regex):
        """Set test start point in log"""
        i = self._find(regex, start=self._start)
        self._end = i
        return self.records[i]

    def find(self, regex):
        """Find record matching regex between head and end"""
        i = self._find(regex, self._head, self._end)
        self._head = i + 1
        return self.records[i]

    def get_git_rev_info(self):
        """Helper for getting target branch name"""
        if self.new_fmt:
            rev_re = r'INFO: Using Git branch:revision (\S+):(\S+)'
        else:
            rev_re = r'Running on (\S+):(\S+)'
        branch, rev = re.match(rev_re, self.records[0].msg).groups()
        # Map all detached checkouts to '(nobranch)'
        if branch.startswith('(detachedfrom') or branch.startswith('(HEADdetachedat'):
            branch = '(nobranch)'
        return branch, rev

    def get_test_descr(self):
        """Helper for getting test description from 'start' row"""
        return self.records[self._start].msg.split(':', 1)[1].strip()

    def get_sysres_meas_start_time(self):
        """Helper for getting 'legend' for next sysres measurement"""
        record = self.find("Timing: ")
        return record.time

    def get_sysres_meas_time(self):
        """Helper for getting wall clock time of sysres measurement"""
        msg = self.find("TIME: ").msg
        return msg.split(':', 1)[1].strip()

    def get_du_meas_size(self):
        """Helper for getting size of du measurement"""
        msg = self.find(".*SIZE of.*: ").msg
        value = msg.split(':', 1)[1].strip()
        # Split out possible unit
        return int(value.split()[0])


def time_log_to_json(time_log):
    """Convert time log to json results"""
    def str_time_to_timedelta(strtime):
        """Convert time strig from the time utility to timedelta"""
        split = strtime.split(':')
        hours = int(split[0]) if len(split) > 2 else 0
        mins = int(split[-2]) if len(split) > 1 else 0

        split = split[-1].split('.')
        secs = int(split[0])
        frac = split[1] if len(split) > 1 else '0'
        microsecs = int(float('0.' + frac) * pow(10, 6))

        return timedelta(0, hours*3600 + mins*60 + secs, microsecs)

    res = {'rusage': {}}
    log.debug("Parsing time log: %s", time_log)
    exit_status = None
    with open(time_log) as fobj:
        for line in fobj.readlines():
            key, val = line.strip().rsplit(' ', 1)
            val = val.strip()
            key = key.rstrip(':')
            # Parse all fields
            if key == 'Exit status':
                exit_status = int(val)
            elif key.startswith('Elapsed (wall clock)'):
                res['elapsed_time'] = str_time_to_timedelta(val)
            elif key == 'User time (seconds)':
                res['rusage']['ru_utime'] = str_time_to_timedelta(val)
            elif key == 'System time (seconds)':
                res['rusage']['ru_stime'] = str_time_to_timedelta(val)
            elif key == 'Maximum resident set size (kbytes)':
                res['rusage']['ru_maxrss'] = int(val)
            elif key == 'Major (requiring I/O) page faults':
                res['rusage']['ru_majflt'] = int(val)
            elif key == 'Minor (reclaiming a frame) page faults':
                res['rusage']['ru_minflt'] = int(val)
            elif key == 'Voluntary context switches':
                res['rusage']['ru_nvcsw'] = int(val)
            elif key == 'Involuntary context switches':
                res['rusage']['ru_nivcsw'] = int(val)
            elif key == 'File system inputs':
                res['rusage']['ru_inblock'] = int(val)
            elif key == 'File system outputs':
                res['rusage']['ru_oublock'] = int(val)
    if exit_status is None:
        raise ConversionError("Truncated log file '{}'".format(
            os.path.basename(time_log)))
    return exit_status, res

def optimize_buildstat_task(task_data):
    """Optimize JSON formatted buildstat task data"""
    if 'child_rusage' in task_data:
        for key, val in task_data['child_rusage'].items():
            task_data['rusage'][key] += val
        del(task_data['child_rusage'])

def optimize_buildstats(buildstats):
    """Optimize buildstats data"""
    for recipe in buildstats:
        for task, data in recipe['tasks'].items():
            optimize_buildstat_task(data)

def optimize_buildstats_file(buildstats_file):
    """Optimize buildstats JSON file"""
    with open(buildstats_file) as fobj:
        buildstats = json.load(fobj, object_pairs_hook=OrderedDict)

    optimize_buildstats(buildstats)

    # Write buildstats back into json file
    with open(buildstats_file, 'w') as fobj:
        json.dump(buildstats, fobj)

def combine_buildstats_files(results_data, results_dir):
    """Combine buildstats into one JSON file"""
    buildstats = OrderedDict()
    new_buildstats_file = os.path.join(results_dir, 'buildstats.json')

    if os.path.exists(new_buildstats_file):
        # Do not overwrite an existing buildstats file
        log.debug("Conbined buildstats file already exists")
        return

    for test in results_data['tests'].values():
        for measurement in test['measurements'].values():
            if 'buildstats_file' in measurement['values']:
                buildstats_file = os.path.join(results_dir,
                                               measurement['values']['buildstats_file'])
                with open(buildstats_file) as fobj:
                    meas_bs = json.load(fobj, object_pairs_hook=OrderedDict)
                optimize_buildstats(meas_bs)

                bs_key = test['name'] + '.' + measurement['name']
                buildstats[bs_key] = meas_bs

                # Remove separate buildstats file
                del(measurement['values']['buildstats_file'])
                os.unlink(buildstats_file)

    # Write-out combined buildstats
    with open(os.path.join(results_dir, 'buildstats.json'), 'w') as fobj:
        json.dump(buildstats, fobj)


def convert_buildstats(indir, outfile, optimize=False):
    """Convert buildstats into JSON format"""

    def split_nevr(nevr):
        """Split name and version information from recipe "nevr" string"""
        n_e_v, revision = nevr.rsplit('-', 1)
        match = re.match(r'^(?P<name>\S+)-((?P<epoch>[0-9]{1,5})_)?(?P<version>[0-9]\S*)$',
                         n_e_v)
        if not match:
            # If we're not able to parse a version starting with a number, just
            # take the part after last dash
            match = re.match(r'^(?P<name>\S+)-((?P<epoch>[0-9]{1,5})_)?(?P<version>[^-]+)$',
                             n_e_v)
        name = match.group('name')
        version = match.group('version')
        epoch = match.group('epoch')
        return name, epoch, version, revision

    def bs_to_json(filename):
        """Convert (task) buildstats file into json format"""
        bs_json = OrderedDict((('iostat', {}),
                               ('rusage', {}),
                               ('child_rusage', {})))
        end_time = None
        with open(filename) as fobj:
            for line in fobj.readlines():
                key, val = line.split(':', 1)
                val = val.strip()
                if key == 'Started':
                    start_time = datetime.utcfromtimestamp(float(val))
                    bs_json['start_time'] = start_time
                elif key == 'Ended':
                    end_time = datetime.utcfromtimestamp(float(val))
                elif key.startswith('IO '):
                    split = key.split()
                    bs_json['iostat'][split[1]] = int(val)
                elif key.find('rusage') >= 0:
                    split = key.split()
                    ru_key = split[-1]
                    if ru_key in ('ru_stime', 'ru_utime'):
                        val = float(val)
                    else:
                        val = int(val)
                    ru_type = 'rusage' if split[0] == 'rusage' else \
                                                      'child_rusage'
                    bs_json[ru_type][ru_key] = val
                elif key == 'Status':
                    bs_json['status'] = val
        if end_time is None:
            return None
        bs_json['elapsed_time'] = end_time - start_time

        # Remove empty stats
        for key in ('iostat', 'rusage', 'child_rusage'):
            if not bs_json[key]:
                del(bs_json[key])

        if optimize:
            optimize_buildstat_task(bs_json)

        return bs_json

    log.debug('Converting buildstats %s -> %s', indir, outfile)
    buildstats = []
    for fname in os.listdir(indir):
        recipe_dir = os.path.join(indir, fname)
        if not os.path.isdir(recipe_dir):
            continue
        name, epoch, version, revision = split_nevr(fname)
        recipe_bs = {'name': name,
                     'epoch': epoch,
                     'version': version,
                     'revision': revision,
                     'tasks': {}}
        for task in os.listdir(recipe_dir):
            task_bs = bs_to_json(os.path.join(recipe_dir, task))
            if not task_bs:
                raise ConversionError("Incomplete buildstats in {}:{}".format(
                    fname, task))
            recipe_bs['tasks'][task] = task_bs
        buildstats.append(recipe_bs)

    # Write buildstats into json file
    with open(outfile, 'w') as fobj:
        json.dump(buildstats, fobj, sort_keys=True,
                  cls=ResultsJsonEncoder)


def convert_results(poky_repo, results_dir, tester_host, out_fmt,
                    metadata_override, buildstats):
    """Convert results to new JSON or XML based format."""
    if os.path.exists(os.path.join(results_dir, 'results.json')):
        return convert_json_results(poky_repo, results_dir, out_fmt,
                                    metadata_override, buildstats)
    elif os.path.exists(os.path.join(results_dir, 'results.xml')):
        return convert_xml_results(results_dir, out_fmt, metadata_override,
                                   buildstats)
    elif os.path.exists(os.path.join(results_dir, 'output.log')):
        return convert_old_results(poky_repo, results_dir, tester_host, out_fmt,
                                   metadata_override, buildstats)
    raise ConversionError("No result data found")


def update_metadata(metadata, override):
    """Update metadata from override template"""
    for key, value in override.items():
        if isinstance(value, MutableMapping):
            metadata[key] = update_metadata(metadata.get(key, value.__class__()),
                                            value)
        else:
            metadata[key] = value

    return metadata


def create_metadata(hostname, rev_info):
    """Helper for constructing metadata.

    Create metadata dict from scratch. Involves a lot of guessing/hardcoding."""
    default_config = OrderedDict((('BB_NUMBER_THREADS', '8'),
                                  ('MACHINE', 'qemux86'),
                                  ('PARALLEL_MAKE', '-j 8')))
    metadata = OrderedDict((('hostname', hostname),
                            ('distro', OrderedDict(id='poky')),
                            ('config', default_config)))

    # Special handling for branch
    branch = '(nobranch)' if rev_info['branch'] == 'None' else rev_info['branch']
    rev_dict = OrderedDict([('commit', rev_info['commit']),
                            ('commit_count', rev_info['commit_count']),
                            ('branch', rev_info['branch'])])

    metadata['layers'] = OrderedDict()
    for layer in ('meta', 'meta-poky', 'meta-yocto-bsp'):
        metadata['layers'][layer] = rev_dict

    metadata['bitbake'] = rev_dict

    return metadata


def convert_old_results(poky_repo, results_dir, tester_host, new_fmt,
                        metadata_override, buildstats):
    """Convert 'old style' to new JSON or XML based format.

    Conversion is a destructive operation, converted files being deleted.
    """
    test_descriptions = {'test1': "Build core-image-sato",
                         'test12': "Build virtual/kernel",
                         'test13': "Build core-image-sato with rm_work enabled",
                         'test2': "Run core-image-sato do_rootfs with sstate",
                         'test3': "Bitbake parsing (bitbake -p)",
                         'test4': "eSDK metrics"}
    test_params = OrderedDict([
        ('test1', {'log_start_re': "Running Test 1, part 1/3",
                   'log_end_re': "Buildstats are saved in.*-test1$",
                   'meas_params': [('sysres', (1, 'build', 'bitbake core-image-sato')),
                                   ('diskusage', ('tmpdir', 'tmpdir'))],
                   }),
        ('test12', {'log_start_re': "Running Test 1, part 2/3",
                   'log_end_re': "More stats can be found in.*results.log.2",
                   'meas_params': [('sysres', (2, 'build', 'bitbake virtual/kernel'))],
                   }),
        ('test13', {'log_start_re': "Running Test 1, part 3/3",
                    'log_end_re': "Buildstats are saved in.*-test13$",
                    'meas_params': [('sysres', (3, 'build', 'bitbake core-image-sato')),
                                    ('diskusage', ('tmpdir', 'tmpdir'))],
                    }),
        ('test2', {'log_start_re': "Running Test 2",
                   'log_end_re': "More stats can be found in.*results.log.4",
                   'meas_params': [('sysres', (4, 'do_rootfs', 'bitbake do_rootfs'))],
                   }),
        ('test3', {'log_start_re': "Running Test 3",
                   'log_end_re': "More stats can be found in.*results.log.7",
                   'meas_params': [('sysres', (5, 'parse_1', 'bitbake -p (no caches)')),
                                   ('sysres', (6, 'parse_2', 'bitbake -p (no tmp/cache)')),
                                   ('sysres', (7, 'parse_3', 'bitbake -p (cached)'))],
                   }),
        ('test4', {'log_start_re': "Running Test 4",
                   'log_end_re': "All done, cleaning up",
                   'meas_params': [('diskusage', ('installer_bin', 'eSDK installer')),
                                   ('sysres', (8, 'deploy', 'eSDK deploy')),
                                   ('diskusage', ('deploy_dir', 'deploy dir'))],
                   })
         ])

    def _import_test(topdir, name, output_log, log_start_re, log_end_re,
                     meas_params):
        """Import test results from one results.log.X into JSON format"""
        test_res = {'name': name,
                    'measurements': OrderedDict(),
                    'status': 'SUCCESS'}
        start_time = output_log.set_start(log_start_re).time
        end_time = output_log.set_end(log_end_re).time
        test_res['description'] = test_descriptions[name]
        test_res['start_time'] = start_time
        test_res['elapsed_time'] = end_time - start_time
        for meas_type, params in meas_params:
            measurement = {'type': meas_type}
            if meas_type == 'sysres':
                i, meas_name, meas_legend = params
                start_time = output_log.get_sysres_meas_start_time()

                time_log_fn = os.path.join(topdir, 'results.log.{}'.format(i))
                if not os.path.isfile(time_log_fn):
                    raise ConversionError("results.log.{} not found".format(i))
                exit_status, measurement['values'] = time_log_to_json(time_log_fn)
                # Remove old results.log
                os.unlink(time_log_fn)

                if exit_status != 0:
                    log.debug("Detected failed test %s in %s", name, topdir)
                    test_res['status'] = 'ERROR'
                    # Consider the rest of the measurements (including this)
                    # invalid. Return what we got so far
                    return test_res

                measurement['values']['start_time'] = start_time
            elif meas_type == 'diskusage':
                meas_name, meas_legend = params
                try:
                    measurement['values'] = {'size': output_log.get_du_meas_size()}
                except ConversionError:
                    # Test4 might not have the second du measurement
                    if meas_name == 'deploy_dir':
                        log.debug("deploy_dir measurement for test4 not found")
                        continue
                    else:
                        raise
            else:
                raise CommitError("BUG: invalid measurement type: {}".format(meas_type))

            measurement['name'] = meas_name
            measurement['legend'] = meas_legend
            assert meas_name not in test_res['measurements']
            test_res['measurements'][meas_name] = measurement
        return test_res


    # Read main logfile
    out_log = OutputLog(os.path.join(results_dir, 'output.log'))
    if out_log.new_fmt:
        raise ConversionError("New output.log format detected, refusing to "
                              "convert results")
    git_branch, git_rev = out_log.get_git_rev_info()

    # We don't want the big log files taking space
    for path in glob(results_dir + '/*.log'):
        if os.path.basename(path) != 'output.log':
            os.unlink(path)

    tests = OrderedDict()

    # Parse test results
    for test, params in test_params.items():
        # Special handling for test4
        if (test == 'test4' and
                not os.path.exists(os.path.join(results_dir, 'results.log.8'))):
            continue
        try:
            tests[test] = _import_test(results_dir, test, out_log, **params)
        except ConversionError as err:
            raise ConversionError("Presumably incomplete test run. Unable to "
                                  "parse '{}' from output.log: {}".format(test, err))

    # Convert buildstats
    for path in glob(results_dir + '/buildstats-*'):
        testname = os.path.basename(path).split('-', 1)[1]
        if not testname in ('test1', 'test13'):
            raise CommitError("Unkown buildstats: {}".format(
                os.path.basename(path)))

        # No measurements indicates failed test -> don't import buildstats
        if tests[testname]['measurements'] and buildstats != 'n':
            bs_relpath = os.path.join(testname, 'buildstats.json')
            os.mkdir(os.path.join(results_dir, testname))
            try:
                convert_buildstats(path, os.path.join(results_dir, bs_relpath),
                                   buildstats == 'o')
            except ConversionError as err:
                log.warn("Buildstats for %s not imported: %s", testname, err)
            else:
                # We know that buildstats have only been saved for the 'build'
                # measurement of the two tests.
                tests[testname]['measurements']['build']['values']['buildstats_file'] = \
                    bs_relpath
        # Remove old buildstats directory
        shutil.rmtree(path)

    # Create final results dict
    cmd = ['rev-list', '--count', git_rev, '--']
    commit_cnt = poky_repo.run_cmd(cmd).splitlines()[0]
    results = OrderedDict((('tester_host', tester_host),
                           ('start_time', out_log.records[0].time),
                           ('elapsed_time', (out_log.records[-1].time -
                                             out_log.records[0].time)),
                           ('tests', tests)))

    # Combine buildstats
    if buildstats == 'c':
        combine_buildstats_files(results, results_dir)

    # Create metadata dict
    metadata = create_metadata(tester_host,
                               {'commit': git_rev,
                                'commit_count': commit_cnt,
                                'branch': git_branch})
    metadata = update_metadata(metadata, metadata_override)

    # Write metadata and results files
    if new_fmt == 'json':
        write_results_json(results_dir, metadata, results)
    elif new_fmt == 'xml':
        write_results_xml(results_dir, metadata, results)
    else:
        raise NotImplementedError("Unknown results format '{}'".format(new_fmt))

    return True


def convert_json_results(poky_repo, results_dir, new_fmt, metadata_override,
                         buildstats):
    """Convert JSON formatted results"""
    metadata_file = os.path.join(results_dir, 'metadata.json')
    results_file = os.path.join(results_dir, 'results.json')

    with open(results_file) as fobj:
        results = json.load(fobj, object_pairs_hook=OrderedDict)

    if os.path.exists(metadata_file):
        with open(metadata_file) as fobj:
            metadata = json.load(fobj, object_pairs_hook=OrderedDict)
        # Remove old metadata file
        os.unlink(metadata_file)
    else:
        metadata = create_metadata(results['tester_host'],
                                   {'commit': results.pop('git_commit'),
                                    'commit_count': results.pop('git_commit_count'),
                                    'branch': results.pop('git_branch')})

        # Remove metadata from the results dict
        results.pop('product')

    # Make corrections in the JSON data
    metadata = update_metadata(metadata, metadata_override)
    test_status_map = {'FAIL': 'FAILURE',
                       'EXP_FAIL': 'EXPECTED_FAILURE',
                       'UNEXP_SUCCESS': 'UNEXPECTED_SUCCESS'}
    for test in results['tests'].values():
        # Correct test status
        if not test['status'] in TEST_STATUSES:
            test['status'] = test_status_map[test['status']]

        # Put measurements in a dict
        if isinstance(test['measurements'], list):
            measurements = OrderedDict()
            for measurement in test['measurements']:
                measurements[measurement['name']] = measurement
            test['measurements'] = measurements

        # We don't want the big log files taking space
        if 'cmd_log_file' in test:
            log_file = os.path.join(results_dir, test['cmd_log_file'])
            del(test['cmd_log_file'])
        else:
            log_file = os.path.join(results_dir, test['name'], 'commands.log')
        if os.path.exists(log_file):
            os.unlink(log_file)

        for measurement in test['measurements'].values():
            if 'buildstats_file' in measurement['values']:
                buildstats_file = os.path.join(results_dir,
                                               measurement['values']['buildstats_file'])
                # Remove buildstats
                if buildstats == 'n':
                    os.unlink(buildstats_file)
                    del(measurement['values']['buildstats_file'])
                # Optimize buildstats
                elif buildstats == 'o':
                    optimize_buildstats_file(buildstats_file)

    # Combine buildstats
    if buildstats == 'c':
        combine_buildstats_files(results, results_dir)

    # Remove old results file
    os.unlink(results_file)

    # Write metadata and results files
    if new_fmt == 'json':
        write_results_json(results_dir, metadata, results)
    elif new_fmt == 'xml':
        write_results_xml(results_dir, metadata, results)
    else:
        raise NotImplementedError("Unknown results format '{}'".format(new_fmt))

    return True


def convert_xml_results(results_dir, new_fmt, metadata_override, buildstats):
    """Convert XML formatted results"""
    metadata_file = os.path.join(results_dir, 'metadata.xml')
    results_file = os.path.join(results_dir, 'results.xml')

    # Mangle metadata
    xml_metadata = ET.parse(metadata_file)
    metadata = metadata_xml_to_dict(xml_metadata)
    metadata = update_metadata(metadata, metadata_override)
    os.unlink(metadata_file)

    # Combine buildstats
    results = read_results_xml(ET.parse(results_file))
    os.unlink(results_file)
    if buildstats == 'c':
        combine_buildstats_files(results, results_dir)

    # Write-out new data
    if new_fmt == 'json':
        write_results_json(results_dir, metadata, results)
    elif new_fmt == 'xml':
        write_results_xml(results_dir, metadata, results)
    else:
        raise NotImplementedError("Unknown results format '{}'".format(new_fmt))
    return True


def write_results_json(results_dir, metadata, results):
    """Write results into a JSON formatted file"""
    with open(os.path.join(results_dir, 'metadata.json'), 'w') as fobj:
        json.dump(metadata, fobj, indent=4)
    with open(os.path.join(results_dir, 'results.json'), 'w') as fobj:
        json.dump(results, fobj, indent=4, cls=ResultsJsonEncoder)

def metadata_dict_to_xml(tag, dictionary, **kwargs):
    elem = ET.Element(tag, **kwargs)
    for key, val in dictionary.items():
        if tag == 'layers':
            child = (metadata_dict_to_xml('layer', val, name=key))
        elif isinstance(val, MutableMapping):
            child = (metadata_dict_to_xml(key, val))
        else:
            if tag == 'config':
                child = ET.Element('variable', name=key)
            else:
                child = ET.Element(key)
            child.text = str(val)
        elem.append(child)
    return elem

def metadata_xml_to_dict(etree):
    root = etree.getroot()
    assert root.tag == 'metadata', "Invalid metadata file format"

    def _xml_to_dict(elem):
        out = OrderedDict()
        for child in elem.getchildren():
            key = child.attrib.get('name', child.tag)
            if len(child):
                out[key] = _xml_to_dict(child)
            else:
                out[key] = child.text
        return out
    return _xml_to_dict(root)

def isoformat_to_dt(string):
    """Convert timestamp string in ISO 8601 format into datetime object"""
    if '.' in string:
        return datetime.strptime(string, '%Y-%m-%dT%H:%M:%S.%f')
    else:
        return datetime.strptime(string, '%Y-%m-%dT%H:%M:%S')

def read_results_xml(etree):
    """Convert xml etree into JSON format"""
    def _read_measurement(elem):
        data = OrderedDict()
        data['type'] = elem.tag
        data['name'] = elem.attrib['name']
        data['legend'] = elem.attrib['legend']
        values = OrderedDict()

        # SYSRES measurement
        if elem.tag == 'sysres':
            for subel in elem:
                if subel.tag == 'time':
                    values['start_time'] = isoformat_to_dt(subel.attrib['timestamp'])
                    values['elapsed_time'] = float(subel.text)
                elif subel.tag == 'rusage':
                    rusage = OrderedDict()
                    for field in BS_RUSAGE_FIELDS:
                        if 'time' in field:
                            rusage[field] = float(subel.attrib[field])
                        else:
                            rusage[field] = int(subel.attrib[field])
                    values['rusage'] = rusage
                elif subel.tag == 'iostat':
                    values['iostat'] = OrderedDict([(f, int(subel.attrib[f])) for f in BS_IOSTAT_FIELDS])
                elif subel.tag == 'buildstats_file':
                    values['buildstats_file'] = subel.text
                else:
                    raise TypeError("Unknown sysres value element '{}'".format(subel.tag))
        # DISKUSAGE measurement
        elif elem.tag == 'diskusage':
            values['size'] = int(elem.find('size').text)
        else:
            raise Exception("Unknown measurement tag '{}'".format(elem.tag))
        data['values'] = values
        return data

    def _read_case(elem):
        """Convert testcase into JSON"""
        data = OrderedDict()
        data['name'] = elem.attrib['name']
        data['description'] = elem.attrib['description']
        data['status'] = 'SUCCESS'
        data['start_time'] = isoformat_to_dt(elem.attrib['timestamp'])
        data['elapsed_time'] = float(elem.attrib['time'])
        measurements = OrderedDict()

        for subel in elem.getchildren():
            if subel.tag == 'error' or subel.tag == 'failure':
                data['status'] = subel.tag.upper()
                data['message'] = subel.attrib['message']
                print(len(data['message'].splitlines()))
                data['err_type'] = subel.attrib['type']
                data['err_output'] = subel.text
            elif subel.tag == 'skipped':
                data['status'] = 'SKIPPED'
                data['message'] = subel.text
            else:
                measurements[subel.attrib['name']] = _read_measurement(subel)
        data['measurements'] = measurements
        return data

    def _read_suite(elem):
        """Convert suite to JSON"""
        data = OrderedDict()
        data['tester_host'] = elem.attrib['hostname']
        data['start_time'] = isoformat_to_dt(elem.attrib['timestamp'])
        data['elapsed_time'] = float(elem.attrib['time'])
        tests = OrderedDict()

        for case in elem.getchildren():
            tests[case.attrib['name']] = _read_case(case)
        data['tests'] = tests
        return data

    # Main function
    root = etree.getroot()
    assert root.tag == 'testsuites', "Invalid test report format"
    assert len(root) == 1, "Too many testsuites"

    return _read_suite(root.getchildren()[0])

def write_pretty_xml(tree, out_file):
    """Write out XML element tree into a file"""
    # Use minidom for pretty-printing
    dom_doc = minidom.parseString(ET.tostring(tree.getroot(), 'utf-8'))
    with open(out_file, 'w') as fobj:
        dom_doc.writexml(fobj, addindent='  ', newl='\n', encoding='utf-8')
    #tree.write(out_file, encoding='utf-8', xml_declaration=True)


def timestamp_to_isoformat(timestamp):
    """Convert unix timestamp to isoformat"""
    if isinstance(timestamp, datetime):
        return timestamp.isoformat()
    else:
        return datetime.utcfromtimestamp(timestamp).isoformat()

def xml_encode(obj):
    """Encode value for xml"""
    if isinstance(obj, timedelta):
        return str(obj.total_seconds())
    else:
        return str(obj)

def write_results_xml(results_dir, metadata, results):
    """Write test results into a JUnit XML file"""
    # Write metadata
    tree = ET.ElementTree(metadata_dict_to_xml('metadata', metadata))
    write_pretty_xml(tree, os.path.join(results_dir, 'metadata.xml'))

    # Write results
    test_classes = {'test1': 'Test1P1',
                    'test12': 'Test1P2',
                    'test13': 'Test1P3',
                    'test2': 'Test2',
                    'test3': 'Test3',
                    'test4': 'Test4'}

    top = ET.Element('testsuites')
    suite = ET.SubElement(top, 'testsuite')
    suite.set('hostname', results['tester_host'])
    suite.set('name', 'oeqa.buildperf')
    suite.set('timestamp', timestamp_to_isoformat(results['start_time']))
    suite.set('time', xml_encode(results['elapsed_time']))

    test_cnt = skip_cnt = fail_cnt = err_cnt = 0
    for test in results['tests'].values():
        test_cnt += 1
        testcase = ET.SubElement(suite, 'testcase')
        testcase.set('classname', 'oeqa.buildperf.test_basic.' + test_classes[test['name']])
        testcase.set('name', test['name'])
        testcase.set('description', test['description'])
        testcase.set('timestamp', timestamp_to_isoformat(test['start_time']))
        testcase.set('time', xml_encode(test['elapsed_time']))
        status = test['status']
        if status in ('ERROR', 'FAILURE', 'EXPECTED_FAILURE'):
            if status in ('FAILURE', 'EXPECTED_FAILURE'):
                result = ET.SubElement(testcase, 'failure')
                fail_cnt += 1
            else:
                result = ET.SubElement(testcase, 'error')
                err_cnt += 1
            if 'message' in test:
                result.set('message', test['message'])
                result.set('type', test['err_type'])
                result.text = test['err_output']
        elif status == 'SKIPPED':
            result = ET.SubElement(testcase, 'skipped')
            result.text = test['message']
            skip_cnt += 1
        elif status not in ('SUCCESS', 'UNEXPECTED_SUCCESS'):
            raise TypeError("BUG: invalid test status '%s'" % status)

        for data in test['measurements'].values():
            measurement = ET.SubElement(testcase, data['type'])
            measurement.set('name', data['name'])
            measurement.set('legend', data['legend'])
            vals = data['values']
            if data['type'] == 'sysres':
                timestamp = timestamp_to_isoformat(vals['start_time'])
                ET.SubElement(measurement, 'time', timestamp=timestamp).text = \
                    xml_encode(vals['elapsed_time'])
                for key, val in vals.items():
                    if key == 'rusage':
                        attrib = dict((k, xml_encode(v)) for k, v in vals['rusage'].items())
                        ET.SubElement(measurement, 'rusage', attrib=attrib)
                    elif key == 'iostat':
                        attrib = dict((k, xml_encode(v)) for k, v in vals['iostat'].items())
                        ET.SubElement(measurement, 'iostat', attrib=attrib)
                    elif key == 'buildstats_file':
                        ET.SubElement(measurement, 'buildstats_file').text = vals['buildstats_file']
                    elif key not in ('start_time', 'elapsed_time'):
                        raise TypeError("Unkown measurement value {}: '{}'".format(key, val))
            elif data['type'] == 'diskusage':
                ET.SubElement(measurement, 'size').text = str(vals['size'])
            else:
                raise TypeError('BUG: unsupported measurement type')
    suite.set('tests', str(test_cnt))
    suite.set('failures', str(fail_cnt))
    suite.set('errors', str(err_cnt))
    suite.set('skipped', str(skip_cnt))

    # Use minidom for pretty-printing
    tree = ET.ElementTree(top)
    write_pretty_xml(tree, os.path.join(results_dir, 'results.xml'))


def git_commit_dir(data_repo, src_dir, branch, msg, tag=None, tag_msg="",
                   timestamp=None):
    """Commit the content of a directory to a branch"""
    env = {'GIT_WORK_TREE': os.path.abspath(src_dir)}
    if timestamp:
        env['GIT_COMMITTER_DATE'] = timestamp
        env['GIT_AUTHOR_DATE'] = timestamp

    log.debug('Committing %s to git branch %s', src_dir, branch)
    data_repo.run_cmd(['symbolic-ref', 'HEAD', 'refs/heads/' + branch], env)
    data_repo.run_cmd(['add', '.'], env)
    data_repo.run_cmd(['commit', '-m', msg], env)

    log.debug('Tagging %s', tag)
    data_repo.run_cmd(['tag', '-a', '-m', tag_msg, tag, 'HEAD'], env)


def git_notes_add(data_repo, fname, ref, obj, timestamp=None):
    """Add git notes"""
    env = {}
    if timestamp:
        env['GIT_COMMITTER_DATE'] = timestamp
        env['GIT_AUTHOR_DATE'] = timestamp

    log.debug('Adding %s to git notes (%s)', fname, ref)
    data_repo.run_cmd(['notes', '--ref', ref, 'add', '-F', fname, obj], env)


def import_testrun(archive, data_repo, poky_repo, branch_fmt, tag_fmt,
                   convert=False, metadata_override=None, buildstats='y'):
    """Import one testrun into Git"""
    archive = os.path.abspath(archive)
    archive_fn = os.path.basename(archive)

    if os.path.isfile(archive):
        fields = archive_fn.rsplit('-', 3)
        fn_fields = {'timestamp': fields[-1].split('.')[0],
                     'rev': fields[-2],
                     'host': fields[0]}
        if len(fields) != 4:
            log.warn('Invalid archive %s, skipping...', archive)
            return False, "Invalid filename"
    elif os.path.isdir(archive):
        fn_fields = {'timestamp': None,
                     'rev': None,
                     'host': os.environ.get('BUILD_PERF_GIT_IMPORT_HOST')}
        if not fn_fields['host'] and not convert:
            raise CommitError("You need to define tester host in "
                              "BUILD_PERF_GIT_IMPORT_HOST env var "
                              "when raw importing directories")
    else:
        raise CommitError("{} does not exist".format(archive))

    tmpdir = os.path.abspath(tempfile.mkdtemp(dir='.'))
    try:
        # Unpack tarball
        if os.path.isfile(archive):
            log.info('Unpacking %s', archive)
            # Unpack in two stages in order to skip (possible) build data
            check_output(['tar', '-xf', archive, '-C', tmpdir,
                          '--exclude', 'build/*'])
            try:
                check_output(['tar', '-xf', archive, '-C', tmpdir,
                              '--wildcards', '*/build/conf'])
            except CalledProcessError:
                log.warn("Archive doesn't contain build/conf")
            if len(os.listdir(tmpdir)) > 1:
                log.warn("%s contains multiple subdirs!", archive)
            results_dir = '{}-{}-{}'.format('results', fn_fields['rev'],
                                            fn_fields['timestamp'])
            results_dir = os.path.join(tmpdir, results_dir)
            if not os.path.exists(results_dir):
                log.warn("%s does not contain '%s/', skipping...",
                         archive, os.path.basename(results_dir))
                return False, "Invalid content"
        else:
            # Make a safe copy, filtering out possible build data
            results_dir = os.path.join(tmpdir, archive_fn)
            log.debug('Copying %s', archive)
            os.mkdir(results_dir)
            for f in glob(archive + '/*'):
                tgt_path = os.path.join(results_dir, os.path.basename(f))
                if os.path.isfile(f):
                    # Regular files
                    shutil.copy2(f, tgt_path)
                elif os.path.basename(f) == 'build':
                    # From build dir we only want to conf
                    os.mkdir(tgt_path)
                    shutil.copytree(os.path.join(f, 'conf'),
                                    os.path.join(tgt_path, 'conf'))
                else:
                    # Other directories are copied as is
                    shutil.copytree(f, tgt_path)

        # Remove redundant buildstats subdir(s)
        for buildstat_dir in glob(results_dir + '/buildstats-*'):
            buildstat_tmpdir = buildstat_dir + '.tmp'
            shutil.move(buildstat_dir, buildstat_tmpdir)
            builds = sorted(glob(buildstat_tmpdir + '/*'))
            buildstat_subdir = builds[-1]
            if len(builds) != 1:
                log.warn('%s in %s contains multiple builds, using only %s',
                         os.path.basename(buildstat_dir), archive,
                         os.path.basename(buildstat_subdir))

            # Handle the formerly used two-level buildstat directory structure
            # (where build target formed the first level)
            builds = os.listdir(buildstat_subdir)
            if re.match('^20[0-9]{10,12}$', builds[-1]):
                if len(builds) != 1:
                    log.warn('%s in %s contains multiple builds, using only %s',
                             os.path.join(os.path.basename(buildstat_dir), buildstat_subdir), archive,
                             os.path.basename(buildstat_subdir))
                buildstat_subdir = os.path.join(buildstat_subdir, builds[-1])

            shutil.move(buildstat_subdir, buildstat_dir)
            shutil.rmtree(buildstat_tmpdir)

        # Check if the file hierarchy is 'old style'
        converted = False
        log.info("Importing test results from %s", archive_fn)
        if convert:
            try:
                converted = convert_results(poky_repo, results_dir,
                                            fn_fields['host'], convert,
                                            metadata_override, buildstats)
            except ConversionError as err:
                log.warn("Skipping %s, conversion failed: %s", archive_fn, err)
                return False, str(err)
        if converted:
            log.info("    converted results to {}".format(convert.upper()))

        # Get info for git branch and tag names
        fmt_fields = {'host': fn_fields['host'],
                      'product': 'poky',
                      'branch': None,
                      'rev': None,
                      'machine': 'qemux86',
                      'rev_cnt': None}

        if os.path.exists(os.path.join(results_dir, 'metadata.json')):
            with open(os.path.join(results_dir, 'metadata.json')) as fobj:
                data = json.load(fobj)
            fmt_fields['host'] = data['hostname']
            fmt_fields['branch'] = data['layers']['meta']['branch']
            fmt_fields['rev'] = data['layers']['meta']['commit']
            fmt_fields['rev_cnt'] = data['layers']['meta']['commit_count']
            fmt_fields['host'] = data['hostname']

            with open(os.path.join(results_dir, 'results.json')) as fobj:
                data = json.load(fobj)
            git_timestamp = str(data['start_time'])
        elif os.path.exists(os.path.join(results_dir, 'metadata.xml')):
            data = ET.parse(os.path.join(results_dir, 'metadata.xml')).getroot()
            fmt_fields['host'] = data.find('hostname').text
            fmt_fields['branch'] = data.find("layers/layer[@name='meta']/branch").text
            fmt_fields['rev'] = data.find("layers/layer[@name='meta']/commit").text
            fmt_fields['rev_cnt'] = data.find("layers/layer[@name='meta']/commit_count").text

            data = ET.parse(os.path.join(results_dir, 'results.xml')).getroot()
            timestamp = isoformat_to_dt(data.find('testsuite').attrib['timestamp'])
            git_timestamp = "%d" % time.mktime(timestamp.timetuple())
        elif os.path.exists(os.path.join(results_dir, 'results.json')):
            with open(os.path.join(results_dir, 'results.json')) as fobj:
                data = json.load(fobj)
            fmt_fields['host'] = data['tester_host']
            fmt_fields['branch'] = data['git_branch']
            fmt_fields['rev'] = data['git_commit']
            fmt_fields['rev_cnt'] = data['git_commit_count']
            git_timestamp = str(data['start_time'])
        else:
            out_log = OutputLog(os.path.join(results_dir, 'output.log'))
            fmt_fields['branch'], fmt_fields['rev'] = \
                    out_log.get_git_rev_info()
            cmd = ['rev-list', '--count', fmt_fields['rev'], '--']
            fmt_fields['rev_cnt'] = poky_repo.run_cmd(cmd).splitlines()[0]
            git_timestamp = "%d" % time.mktime(out_log.records[0].timestamp.timetuple())
        # Check that the commit is valid
        if poky_repo.rev_parse(fmt_fields['rev']) is None:
            log.warn("Commit %s not found in Poky Git, skipping...", fmt_fields['rev'])
            return False, "Commit {} not found in Poky Git".format(fmt_fields['rev'])

        # Special case for git branch
        if fmt_fields['branch'] == 'None':
            fmt_fields['branch'] = '(nobranch)'

        # Compose git branch and tag name
        git_branch = branch_fmt % fmt_fields
        git_tag = tag_fmt % fmt_fields
        tag_cnt = len(data_repo.run_cmd(['tag', '-l', git_tag + '/*']).splitlines())
        git_tag += '/%d' % tag_cnt

        # Use timestamp from filename, if available
        if fn_fields['timestamp']:
            timestamp = datetime.strptime(fn_fields['timestamp'], '%Y%m%d%H%M%S')
            git_timestamp = "%d" % time.mktime(timestamp.timetuple())

        # Commit to git
        commit_msg = """\
Results of {branch}:{rev} on {host}

branch: {branch}
commit: {rev}
hostname: {host}

""".format(**fmt_fields)

        if os.path.isdir(archive):
            archive_fn += '/'
        if converted:
            commit_msg += "(converted from {})".format(archive_fn)
        else:
            commit_msg += "(imported from {})".format(archive_fn)

        tag_msg = "Test run #{} of {}:{} on {}\n".format(
                tag_cnt, fmt_fields['branch'], fmt_fields['rev'],
                fmt_fields['host'])

        # Store buildstas.json in Git notes, thus move the file away
        bs_file = os.path.join(results_dir, 'buildstats.json')
        bs_tmp = os.path.abspath('buildstats.json.' + str(datetime.now().timestamp()))
        if os.path.exists(bs_file):
            shutil.move(bs_file, bs_tmp)

        # Commit data
        try:
            git_commit_dir(data_repo, results_dir, git_branch, commit_msg,
                           git_tag, tag_msg, git_timestamp)
            if os.path.exists(bs_tmp):
                git_notes_add(data_repo, bs_tmp, 'buildstats/' + git_branch,
                              'HEAD', git_timestamp)
        finally:
            if os.path.exists(bs_tmp):
                os.unlink(bs_tmp)
    finally:
        shutil.rmtree(tmpdir)
    return True, "OK"


def read_globalres(path):
    """Read globalres file"""
    # Read globalres.log
    globalres = defaultdict(list)

    log.info("Reading '%s'", path)
    with open(path) as fobj:
        reader = csv.reader(fobj)
        for row in reader:
            # Skip manually added comments
            if row[0].startswith('#'):
                continue
            res = {'host': row[0]}
            res['branch'], res['revision'] = row[1].split(':')
            if len(row) == 12:
                res['times'] = row[3:10]
                res['sizes'] = row[10:]
            elif len(row) == 14 or len(row) == 15:
                res['times'] = row[3:11]
                res['sizes'] = row[11:]
            else:
                log.warning("globalres: ignoring invalid row that contains "
                            "%s values: %s", len(row), row)
            globalres[res['revision']].append(res)
    return globalres


def get_archive_timestamp(filename):
    """Helper for sorting result tarballs"""
    split = os.path.basename(filename).rsplit('-', 2)
    if len(split) == 4:
        return split[3].split('.')[0]
    elif len(split) == 3:
        return split[2]
    else:
        return filename


def parse_args(argv=None):
    """Parse command line arguments"""
    parser = argparse.ArgumentParser()

    parser.add_argument('-d', '--debug', action='store_true',
                        help='Debug level logging')
    parser.add_argument('-l', '--log-file', type=os.path.abspath,
                        default=datetime.now().strftime('build-perf-git-import-%Y%m%d_%H%M%S.log'),
                        help='Log file to use')
    parser.add_argument('--bare', action='store_true',
                        help="Create a bare repo when initializing a new results repository")
    parser.add_argument('-B', '--git-branch-name',
                        default='%(host)s/%(branch)s/%(machine)s',
                        help="Branch name to use")
    parser.add_argument('-T', '--git-tag-name',
                        default='%(host)s/%(branch)s/%(machine)s/%(rev_cnt)s-g%(rev)s',
                        help="Tag 'basename' to use, tag number will be "
                             "automatically appended")
    parser.add_argument('-c', '--convert', choices=('json', 'xml'),
                        help="Convert results to new format")
    parser.add_argument('-M', '--metadata-override', type=os.path.abspath,
                        help="Pre-filled test metadata in JSON format")
    parser.add_argument('--buildstats', choices=('y', 'n', 'o', 'c'),
                        default='c',
                        help="Import buildstats")
    parser.add_argument('-P', '--poky-git', type=os.path.abspath,
                        help="Path to poky clone")
    parser.add_argument('-g', '--git-dir', type=os.path.abspath, required=True,
                        help="Git repository where to commit results")
    parser.add_argument('archive', nargs="+", type=os.path.abspath,
                        help="Results archive")
    args = parser.parse_args()

    return args


def main(argv=None):
    """Script entry point"""
    args = parse_args(argv)
    if args.debug:
        log.setLevel(logging.DEBUG)
    if args.log_file:
        file_handler = logging.FileHandler(args.log_file)
        file_handler.setFormatter(log.handlers[0].formatter)
        log.addHandler(file_handler)

    ret = 1
    try:
        # Check archives to be imported
        for archive in args.archive:
            if not os.path.exists(archive):
                raise CommitError("File does not exist: {}".format(archive))

        # Check Poky repo
        poky_repo = GitRepo(args.poky_git, is_topdir=True)

        # Check results repository
        if not os.path.exists(args.git_dir):
            log.info('Creating Git repository %s', args.git_dir)
            os.mkdir(args.git_dir)
            data_repo = GitRepo.init(args.git_dir, args.bare)
        else:
            data_repo = GitRepo(args.git_dir, is_topdir=True)

        # Read metadata template
        if args.metadata_override:
            try:
                with open(args.metadata_override) as fobj:
                    metadata = json.load(fobj, object_pairs_hook=OrderedDict)
            except ValueError as err:
                raise CommitError("Metadata template not valid JSON format: {}".format(err))
        else:
            metadata = OrderedDict()

        # Import archived results
        imported = []
        skipped = []
        for archive in sorted(args.archive, key=get_archive_timestamp):
            result = import_testrun(archive, data_repo, poky_repo,
                                    args.git_branch_name, args.git_tag_name,
                                    args.convert, metadata, args.buildstats)
            if result[0]:
                imported.append(result[1])
            else:
                skipped.append((archive, result[1]))

        if not data_repo.bare:
            log.debug('Resetting git worktree')
            data_repo.run_cmd(['reset', '--hard', 'HEAD', '--'])
            data_repo.run_cmd(['clean', '-fd'])

        # Log end report with plain formatting
        formatter = logging.Formatter('%(message)s')
        for handler in log.handlers:
            handler.setFormatter(formatter)
        log.info("\nSuccessfully imported {} archived results".format(len(imported)))
        if skipped:
            log.info("Failed to import {} result archives:".format(len(skipped)))
            for archive, reason in skipped:
                log.info("    {}: {}".format(archive, reason))

        ret = 0
    except CommitError as err:
        if len(str(err)) > 0:
            log.error(str(err))

    return ret

if __name__ == '__main__':
    sys.exit(main())