Whamcloud - gitweb
land 1.0.1 fixes on main development branch (head)
[fs/lustre-release.git] / lustre / ChangeLog
index 8495e29..872df60 100644 (file)
@@ -1,5 +1,200 @@
-TBA
+tbd         Cluster File Systems, Inc. <info@clusterfs.com>
+       * version 1.0.1
+       * bug fixes
+       - remove now-unused request->rq_obd (278)
+       - if an allocation fails, print out how much memory we've used (1933)
+       - use PORTAL_SLAB_ALLOC for structures, to get GFP_MEMALLOC (1933)
+       - add the "configurable stack size" patch to most series files (1256)
+       - ability to write large log records, for 100+ OST configs (2306)
+       - fix NULL deref when filter_prep fails (2314)
+       - fix operator precedence error in filter_sync
+       - dynamic allocation of socknal TX descriptors (2315)
+       - fix a missed case in the GFP_MEMALLOC patch, can cause deadlock (2310)
+       - fix gcc 2.96 compilation problem in xattr kernel patch (2294)
+       - ensure that CWARN messages in Portals always get to the syslog
+       - __init/__exit are not for prototype decls (ldlm_init/exit)
+       - x86-64 compile warning fixes
+       - fix gateway LMC keyword conflict (2318)
+       * miscellania
+       - allow configurable automake binary, for testing new versions
+       - small update to the lfs documentation
+
+2003-12-03  Cluster File Systems, Inc. <info@clusterfs.com>
+       * version 1.0.0
+       * fix negative export reference count in fsfilt_sync (2312)
+
+2003-12-01  Cluster File Systems, Inc. <info@clusterfs.com>
+       * release candidate 0.9.1
+       * bug fixes
+       - orphans are moved into the PENDING directory for possible recovery
+       - replayed opens now open by fid for orphan/rename safety (1042)
+       - last close of an orphan inode generates a transno (683)
+       - chdir() and mount() now pin the directory entry (1020)
+       - avoid CERROR in normal ll_setattr_raw() error case (1500)
+       - discard very old requests without processing them (1502)
+       - remove some common, well-understood CERRORs (1505)
+       - require O_DIRECT I/O to be page-sized to workaround IA64 crash (1609)
+       - clear "grant" flags in OST replies until OST grant code lands (1644)
+       - fix read performance by not clobbering i_blksize on client (1598)
+       - fix __ldlm_handle2lock oops by not dereferencing lock after PUT (1625)
+       - make LRU size a /proc tunable, clears locks when reduced (707)
+       - fix some lprocfs rot that prevented ptlbd from loading (1732)
+       - server locks take references on exports now (1558)
+       - build fixes for 2.4.20-rh trees (1663)
+       - return an error from lov_create if all OSCs are inactive (1751)
+       - fix import levels when a reconnect happens without a timeout (1597)
+       - exit early from mds_open if we get a lookup error (1749)
+       - partial page read at EOF wouldn't wait for disk before sending (1642)
+       - avoid NULL deref in obdfilter when reading page past EOF (1592)
+       - avoid LASSERT in ll_intent_lock if server failed very early (1090)
+       - fix LBUG in ll_it_open_error with rc = -2 (1861)
+       - write/truncate lock inversion (1639)
+       - Don't auto-load obdclass, portals modules during cleanup (1495)
+       - fix timestamps from jumping to "now" (1763)
+       - extra journal assertions (1648)
+       - add an extra multiunlink test (1771)
+       - fix read_record/write_record API (1776)
+       - fix leak of offset_extent, possible incorrect i_size later (1772)
+       - fix lasserts in mis-matched transnos during open-unlink testing (1541)
+       - Debugging for the kqswnal_get_idle_tx problems (1820)
+       - Allow recovery to be attempted multiple times (1536)
+       - Write out MDS last_rcvd file after it is first created (1600)
+       - Fix tx_descriptor leak in failed transmit situations (1827)
+       - ext3 journaling fixes for assertion failure after IO error (1871)
+       - class_export_put() on freed export after completion AST error (1896)
+       - Fix revalidate looping in VFS (1322)
+       - Don't access a freed export during MDS_REINT timeout (1521)
+       - Add open-unlink recovery support on the MDS (1673,1764)
+       - Return an error if no MDS data was read from last_rcvd (1946)
+       - Fix for lookup "." or ".." crash on error (1932,1931,1935)
+       - Don't setup a disk device that doesn't match exported UUID (317)
+       - Reduce bulk RPC timeout to avoid cascading client/OST failures (1845)
+       - avoid committing NULL handle in force close
+       - local.sh is now a one-stripe LOV configuration
+       - POSIX utime.4 -EPERM on FIFO not owned by user (56)
+       - fix ext3 htree duplicate directory entry corruption (1516)
+       - POSIX creat.13, fstat.1, open.18, stat.3 new file atime/mtime (2020)
+       - update to new LOV EA format (2097)
+       - interoperability for different PAGE_SIZE/wordsize (686,1821,1343,2042)
+
+2003-06-15  Phil Schwan  <phil@clusterfs.com>
+       * version v0_7
+       * bug fixes
+       - imports and exports cleanup too early, need refcounts (349, 879, 1045)
+       - per-import/export recovery handling (958, 931, 959)
+       - multiple last-rcvd slots, for serving multiple FSes (949)
+       - connections are again shared between multiple imp/exports (963, 964)
+       - "umount -f" would hang if any requests needed to be sent (393, 978)
+       - avoid pinning large req buffer by copying for queued messages (989)
+       - add "uuid" to "lctl device" command to help upcalls (991)
+       - "open" RPCs with transnos would confuse recovery counters (1037)
+       - do proper endian conversion of all wire messages (288, 340, 891)
+       - remove OST bulk get LBUGs, fix ost_brw_write cleanup (1126)
+       - call waiting locks callback from LDLM recovery thread (1127, 1151)
+       - fix ptlrpc_connection leak in target_handle_connect (1174)
+       - fix import refcounting bug in OST and MDS cleanup (1134)
+       - if an invalid-at-open-time OSC returned before close(), LBUG (1150)
+       - fix very unlikely obd_types race condition (501)
+       - remove osc_open hack for echo_client (1187)
+       - we leaked exports/dlmimps for forcibly disconnected clients (1143)
+       - a failure in read_inode2 leads to deadlock (1139)
+       - cancel ack-locks as soon as transaction is committed (1072)
+       - fix major leaks and crashes in the bulk I/O path (937, 1057)
+       - make sure to commitrw after any preprw to avoid deadlock (1162)
+       - failing to execute a file in a lustre FS would lock inode (1203)
+       - small DEBUG_REQ fix to avoid dereferencing a NULL (1227)
+       - don't ASSERT while cleaning up an incompletely-setup obd (1248)
+       - obd_uuid2tgt would walk off the end of the list (1255)
+       - on IA64 the osc would give portals incorrect bulk size (1258)
+       - fix debug daemon ioctl interface; allows daemon on ia64 (1274)
+       - fix lock inversion caused by new llite matching code (1282)
+       - limit the number of dirty pages on a client to 10MB (1286)
+       - timed out locks were not being corrected cancelled (1289)
+       - fix O_DIRECT above 4GB on IA-32 (1292)
+       * major user-visible changes
+       - fail out/fail over policy now controlled by the upcall (993)
+       * protocol changes
+       - add OBD_PING to check server availability and failure (954)
+       - lustre messages are now sent in sending host order (288, 340, 891)
+       - add eadatalen to MDS getattr reply (340)
+       - OST read replies may contain second buffer, with per-page status (593)
+
+2003-03-11  Phil Schwan  <phil@clusterfs.com>
+       * version v0_6
+       * bug fixes
+       - LDLM_DEBUG macro fix, for gcc 3.2 (850)
+       - failed open()s could cause deadlock; fixed (867, 869)
+       - stop cancelling OST locks when files are closed (481)
+       - overlapping XID spaces caused network corruption (851, 853)
+       - fix unsafe fsfilt counter arithmetic; change to atomic_t
+       - setattr_raw added, to do single-RPC, server-side setattrs
+       - lmc/lconf syntax change for OST UUIDs
+       - fix crashy race condition between ptlrpc_free_req and osc_close
+       - don't use request in mdc_enqueue if we hit a timeout (889)
+       - don't set the inode i_size for regular files from the MDS (896)
+       - handle out of order completion AST (842)
+       - don't LBUG if a lock request times out after receiving AST (913)
+       - avoid d_rehash race in ll_find_alias by rehashing inside dcache_lock
+       - if a bad lock AST arrives, send an error instead of dropping entirely
+       - return 0 from revalidate2 if ll_intent_lock returns -EINTR (912)
+       - fix leak in bulk IO when only partially completed (899, 900, 926)
+       - fix O_DIRECT for ia64 (55)
+        - (almost) eliminate Lustre-kernel-thread effects on load average (722)
+       - C-z after timeout could hang a process forever; fixed (977)
+       * Features
+       - client-side I/O cache (678, 924, 929, 941, 970)
+       * protocol changes
+       - READPAGE and SETATTRs which don't take server-side locks get
+         their own portal
+
+2003-02-11  Phil Schwan  <phil@clusterfs.com>
+       * version v0_5_20
+       * bug fixes
+        - Fix ldlm_lock_match on the MDS to avoid matching remote locks (592)
+        - Fix fsfilt_extN_readpage() to read a full page of directory
+          entries, or fake the remainder if PAGE_SIZE != blocksize (500)
+         - Avoid extra mdc_getattr() in ll_intent_lock when possible (534, 604)
+        - Fix imbalanced LOV object allocation and out-of-bound access (469)
+        - Most intent operations were removed, in favour of a new RPC mode
+          that does a single RPC to the server and bypasses most of the VFS
+        - All LDLM resource ID arrays were removed in favour of ldlm_res_id
+        - Aggressively cancel local locks on DLM servers
+        - mds_reint_unlink sends EA to the client if it's the last nlink.
+          client uses that EA to unlink OST objects.
+        - mds_reint_{rename,unlink,link} were rewritten to take ordered locks
+        - recursive symlinks were fixed (439)
+        - fixed NULL deref in DEBUG_REQ
+        - filter_update_lastobjid no longer calls sync, which annoyed extN
+        - fixed multi-client small-writes to a single file problem (445)
+        - fixed mtime updates during file writes (607)
+        - fixed vector writes on obdfilter causing problems when ENOSPC (670)
+        - fixed bug in obd_brw_read/write() (under guise of testing 367)
+        - fixed Linux OST size reporting problem (444, 656)
+        - OST now updates object mtime with writes or setattr (607, 619)
+        - client verifies file size before zeroing page past EOF (445)
+        - OST now writes last allocated objid to disk with allocation (108)
+        - LOV on echo now works (409)
+       * protocol changes
+        - mds_reint_unlink sends a new buffer, with the EA included.  this
+          buffer is only valid if body->valid & OBD_MD_FLEASIZE, which is only
+          set if a regular file was being unlinked, and it was the last link
+        - use PtlGet from the target for bulk writes (315)
+        - OST now updates object mtime with writes or setattr (607, 619)
+        - LDLM now has a grant-time callback to revalidate locked items, if
+          necessary (604)
+        - Many MDS operations were reorganized to combat race conditions
+       * other changes
+        - Merge b_intel branch (updated lprocfs code) - now at /proc/fs/lustre
+        - configure check to avoid gcc version 2.96 20000731-2.96-98) (606)
+
+2003-01-06  Andreas Dilger  <adilger@clusterfs.com>
+       * version v0_5_19
        * bug fixes
+        - Fully reactivate OST imports after reconnection (512, others)
+        - Make sure client sees our -ENOTCONN from mds_handle (513 - partial)
+        - More graceful error handling for truncating on dead OST (515)
+        - Don't error out unless we're actually accessing dead stripes (474)
+        - Fix garbage sizes when stripes are missing (410)
         - LRU counters were broken, causing constant lock purge (433, 432)
         - garbage on read from stripes with failed OSTs (441)
         - mark OSCs as active before reconnecting during recovery (438)
@@ -14,6 +209,42 @@ TBA
         - bulk descriptors were free()d too soon (511)
         - fix paths in lconf, which would load incorrect modules (451, 507)
         - fix confusing lconf 'host not found' error message (386)
+        - fix lock order deadlock on OST (O/R i_sem before journal ops, 478)
+        - fix race condition in mdc_blocking_ast() for inode access (526)
+        - fix lov_unpackmd() unpacking wrong number of stripes (537)
+        - fix lov_set_osc_active() marking wrong OSC inactive (440)
+        - fix bad lstripe lov_unpackmd() assertion (fix layering too) (527)
+        - fix multiple writes of stripe MD to MDS (358, maybe 519)
+        - fix lstripe in several ways (kernel side) (527)
+        - fix request leak in ldlm_cli_enqueue (262)
+        - incorrect OSC was marked inactive after OST failure
+        - call mds_fs_cleanup before unmounting filesystem (524)
+        - fix races between taking ns_lock and ldlm_lock_change_resource
+        - fix races updating LOV export open file list
+        - fix lov_enqueue error path, avoid decref-ing bad lock handle
+        - fix recovery NULL deref in ldlm_cli_cancel_unused
+        - fix some DLM races by using new hash table for lock handles (419)
+        - permit the client to specify desired inodes, at replay
+        - duplicate requests when we queue them for replay reintegration
+        - fix last_rcvd offset calculation
+        - sync after each recovered transaction, so we always make progress
+        - never, not always, ERESTART requests without transnos
+        - store the lov_desc in the MDS, so we don't depend on getlovinfo to
+          set it
+        - skip replay if the MDS says that the client is already connected
+        - don't check for a recovery-enabled export to match lctl's UUID
+        - don't INC_USE_COUNT for phantom exports
+        - don't crash when cleaning up phantom exports (567)
+        - don't double-finish or set replay data for errored mdc_open requests
+        - abort requests when they time out, so we don't get old replies
+        - send/receive replies for AST messages again
+        - if the client says that it doesn't have the lock, cancel it on the
+          server
+        - if we timeout during I/O, don't try to cancel an in-use lock; instead
+          mark it as destroyed, it will all work out when decref is called
+        - fix module use counts (22, 581)
+       * protocol changes
+        - ASTs now expect a reply (server cancels lock on error reply)
 
 2002-12-02  Andreas Dilger  <adilger@clusterfs.com>
        * version v0_5_18