Whamcloud - gitweb
b=20748
[fs/lustre-release.git] / lustre / ChangeLog
index 08d6c14..6c8d98b 100644 (file)
 tbd  Sun Microsystems, Inc.
        * version 2.0.0
        * Support for kernels:
-        2.6.16.60-0.33 (SLES 10),
-        2.6.18-128.1.1.el5 (RHEL 5),
+        2.6.16.60-0.39.3 (SLES 10),
+        2.6.18-128.7.1.el5 (RHEL 5),
         2.6.22.14 vanilla (kernel.org).
        * Client support for unpatched kernels:
         (see http://wiki.lustre.org/index.php?title=Patchless_Client)
         2.6.16 - 2.6.21 vanilla (kernel.org)
-       * Recommended e2fsprogs version: 1.40.11-sun1
+       * Recommended e2fsprogs version: 1.41.6.sun1
        * Note that reiserfs quotas are disabled on SLES 10 in this kernel.
        * RHEL 4 and RHEL 5/SLES 10 clients behaves differently on 'cd' to a
         removed cwd "./" (refer to Bugzilla 14399).
        * File join has been disabled in this release, refer to Bugzilla 16929.
 
 Severity   : normal
+Bugzilla   : 19557
+Description: Don't allow make backward step on assignin osc next id.
+Details    : race between allocation next id and ll_sync thread can be cause
+             of set wrong osc next id and can be kill valid ost objects.
+
+Severity   : normal
+Bugzilla   : 20533
+Description: Changes in raid5-large-io-rhel5.patch to calculate sectors properly
+
+Severity   : normal
+Bugzilla   : 20533
+Description: Increase the default BLK_DEF_MAX_SECTORS value for RHEL5 and SLES11
+
+Severity   : normal
+Bugzilla   : 20482
+Description: Error handling in osc_statfs_interpret() has been improved.
+Details    : Check in osc_statfs_interpret() for EBADR.
+
+Severity   : normal
+Bugzilla   : 20482
+Description: Do not send statfs() requests to OSTs disabled by administrator.
+Details    : Check in lov_prep_statfs_set() for non-NULL ltd_exp.
+
+Severity   : enhancement
+Bugzilla   : 20200
+Description: Added sanity-quota test to for lfs(1) to work with numeric uid/gid.
+
+Severity   : enhancement
+Bugzilla   : 20400
+Description: Update kernel to RHEL5 2.6.18-128.7.1.el5.
+
+Severity   : enhancement
+Bugzilla   : 20200
+Description: Enhancement for lfs(1) command to use numeric uid/gid.
+
+Severity   : normal
+Bugzilla   : 14951
+Description: Improved cleanup procedure for conf-sanity test_46a.
+
+Severity   : normal 
+Bugzilla   : 18674
+Description: Do not start bulk transfer, if client tried to reconnect.
+Details    : Do not start bulk transfer, if client tried to reconnect,
+            but failed due to active rpcs. Check for exp_abort_active_req
+            has been implemented.
+
+Severity   : normal
+Bugzilla   : 19566
+Description: Prevent inconsistences between linux and lustre mount structures.
+Details    : Wait indefinitely in server_wait_finished() until mnt_count drops.
+            Make the sleep interruptible.
+
+Severity   : enhancement
+Bugzilla   : 19955
+Description: provide server to client comms path
+Details    : server to client communications path via new LDLM_SET_INFO rpc
+       
+Severity   : normal
+Bugzilla   : 20008
+Description: truncate starts GFP_FS allocation under transaction causing deadlock
+Details    : ldiskfs_truncate calls grab_cache_page which may start page
+             allocation under an open transaction. This may lead to
+             calling prune_icache with consequent lustre reentrance.
+
+Severity   : normal
+Bugzilla   : 19934
+Description: send correctly lsm on open replay
+Details    : MDS is trust to LSM size on replay open, but client can set wrong size
+             to lsm buffer.
+
+Severity   : normal
+Bugzilla   : 19854
+Description: enable client interface failover
+Details    : When a child reconnects from another NID, properly update export
+             nid hash position and ldlm reverse import.
+
+Severity   : enhancement
+Bugzilla   : 18539
+Description: Communicate OST degraded/readonly state via statfs to MDS
+Details    : Flags in the statfs returned from OSTs indicate whether the
+            OST is in a degraded RAID state, or if the filesystem has
+            turned read-only after a filesystem error is detected.
+
+Severity   : normal
+Bugzilla   : 20122
+Frequency  : rare
+Description: don't panic if EPROTO was hit when reading symlink
+Details    : correctly handling request reference in error cases.
+
+Severity   : enhancement
+Bugzilla   : 19856
+Description: Add LustreNetLink, a kernel-userspace communcation path.
+
+Severity   : enhancement
+Bugzilla   : 19847
+Description: Update kernel to SLES10 SP2 2.6.16.60-0.39.3.
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 18800
+Description: access to llog context before init.
+Details    : move handling CATALOGS file at osc layer and forbid access to llog
+            context before init.
+
+Severity   : normal
+Frequency  : rare, only when client is writing to OST on local node
+Bugzilla   : 19529
+Description: Avoid deadlock for local client writes
+Details    : Use new OBD_BRW_MEMALLOC flag to notify OST about writes in the
+            memory freeing context. This allows OST threads to set the
+            PF_MEMALLOC flag on task structures in order to allocate memory
+            from reserved pools and complete IO.
+            Use GFP_HIGHUSER for OST allocations for non-local client writes,
+            so that the OST threads generate memory pressure and allow
+            inactive pages to be reclaimed.
+
+Severity   : enhancement
+Bugzilla   : 19846
+Description: Update kernel to RHEL5.3 2.6.18-128.1.14.el5.
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 18380
+Description: lock ordering violation between &cli->cl_sem and _lprocfs_lock
+Details    : move ldlm namespace creation in setup phase to avoid grab
+            _lprocfs_lock with cli_sem held.
+
+Severity   : normal
+Bugzilla   : 19507
+Description: Temporarily disable grant shrink.
+Details    : Disable the feature for debugging.
+
+Severity   : normal
+Frequency  : only when formatting test filesystems
+Bugzilla   : 18624
+Description: Unable to run several mkfs.lustre on loop devices at the same time
+Details    : mkfs.lustre returns error 256 on the concurrent loop devices
+            formatting. The solution is to proper handle the error.
+
+Severity   : enhancement
+Bugzilla   : 19024
+Description: Update kernel to RHEL5.3 2.6.18-128.1.6.el5.
+
+Severity   : enhancement
+Bugzilla   : 19212
+Description: Update kernel to SLES10 SP2 2.6.16.60-0.37.
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 19528
+Description: resolve race between obd_disconnect and class_disconnect_exports
+Details    : if obd_disconnect will be called to already disconnected export he
+            forget release one reference and osc module can't unloaded.
+
+Severity   : enhancement
+Bugzilla   : 18688
+Description: Allow tuning service thread via /proc
+Details    : For each service a new
+            /proc/fs/lustre/{service}/*/thread_{min,max,started} entry is
+            created that can be used to set min/max thread counts, and get the
+            current number of running threads.
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 18382
+Descriptoin: don't return error if have partially created objects for file.
+Details    : lov_update_create_set uses set->set_success as index for created
+            objects, so if some requests will be failed, they will have hole
+            at end of array and qos_shrink_lsm for allocate correct lsm.
+
+Severity   : enhancement
+Bugzilla   : 17671
+Description: Update OFED support to 1.4.1
+
+Severity   : normal
+Frequency  : common
+Bugzilla   : 18645
+Description: Reduce small size read RPC
+Details    : Set read-ahead limit for every file and only do read-ahead when
+            available read-ahead pages are bigger than 1M to avoid small size
+            read RPC.
+
+Severity   : enhancement
+Bugzilla   : 19293
+Description: move AT tunable parameters for more consistent usage
+Details    : add AT tunables under /proc/sys/lustre, add to conf_param parsing
+
+Severity   : enhancement
+Bugzilla   : 17974
+Description: add lazystatfs mount option to allow statfs(2) to skip down OSTs
+Details    : allow skip disconnected ost for send statfs request and hide error
+            in this case.
+
+Severity   : major
+Frequency  : rare
+Bugzilla   : 18810
+Description: fix racy locking of mballoc block bitmaps causing BUG
+Details    : The locking of the mballoc buddy bitmap and the in-memory
+            block bitmap was using two different spin locks in some
+            cases.  This made it possible to incorrectly access the
+            mballoc bitmap while another process was modifying it,
+            causing a sanity assertion to fail.  While no on-disk corruption
+            was reported, there was some risk of this happening.
+
+Severity   : normal
 Frequency  : rare, on llog test 6
 Bugzilla   : 16839
 Descriptoin: don't allow connect to already connected import
@@ -24,14 +229,14 @@ Frequency  : rare
 Bugzilla   : 18902
 Descriptoin: allow kill process which wait statahead result
 Details    : for some reasons 'ls' can stick in waiting result from statahead,
-             in this case need way for kill this process.
+            in this case need way for kill this process.
 
 Severity   : enhancement
 Bugzilla   : 18798
 Description: Add state history info file, enhance import info file
 Details    : Track import connection state changes in a new osc/mdc proc file;
-             add overview-type data to the osc/mdc import proc file.
-       
+            add overview-type data to the osc/mdc import proc file.
+
 Severity   : enhancement
 Bugzilla   : 17536
 Description: MDS create should not wait for statfs RPC while holding DLM lock.
@@ -54,31 +259,31 @@ Frequency  : start MDS on uncleanly shutdowned MDS device
 Bugzilla   : 16839
 Descriptoin: ll_sync thread stay in waiting mds<>ost recovery finished
 Details    : stay in waiting mds<>ost recovery finished produce random bugs
-             due race between two ll_sync thread for one lov target. send
-             ACTIVATE event only if connect realy finished and import have
-             FULL state.
+            due race between two ll_sync thread for one lov target. send
+            ACTIVATE event only if connect realy finished and import have
+            FULL state.
 
 Severity   : normal
 Frequency  : rare, connect and disconnect target at same time
 Bugzilla   : 17310
 Descriptoin: ASSERTION(atomic_read(&imp->imp_inflight) == 0
 Details    : don't call obd_disconnect under lov_lock. this long time
-             operation and can block ptlrpcd which answer to connect request.
+            operation and can block ptlrpcd which answer to connect request.
 
 Severity   : normal
 Frequency  : rare
 Bugzilla   : 18154
 Descriptoin: don't lose wakeup for imp_recovery_waitq
 Details    : recover_import_no_retry or invalidate_import and import_close can
-             both sleep on imp_recovery_waitq, but we was send only one wakeup
-             to sleep queue.
+            both sleep on imp_recovery_waitq, but we was send only one wakeup
+            to sleep queue.
 
 Severity   : normal
 Frequency  : always with long access acl
 Bugzilla   : 17636
 Descriptoin: mds can't pack reply with long acl.
 Details    : mds don't control size of acl but they limited by reint/getattr
-             reply buffer.
+            reply buffer.
 
 Severity   : enhancement
 Bugzilla   : 18061
@@ -99,7 +304,7 @@ Frequency  : on remount
 Bugzilla   : 18018
 Description: external journal device not working after the remount
 Details    : clear dev_rdonly flag for external journal devices in
-             blkdev_put()
+            blkdev_put()
 
 Severity   : minor
 Frequency  : rare
@@ -107,49 +312,49 @@ Bugzilla   : 17802
 Description: shutdown vs evict race
 Details    : client_disconnect_export vs connect request race.
             if client will evicted at this time - we start invalidate
-             thread without referece to import and import can be freed
-             at same time.
+            thread without referece to import and import can be freed
+            at same time.
 
 Severity   : normal
 Frequency  : rare, need acl's on inode.
 Bugzilla   : 16492
 Description: client can't handle ost additional correctly
 Details    : if ost was added after client connected to mds client can have
-             hit lnet_try_match_md ... to big messages to wide striped files.
-             in this case need teach client to handle config events about add
-             lov target and update client max ea size at that event.
+            hit lnet_try_match_md ... to big messages to wide striped files.
+            in this case need teach client to handle config events about add
+            lov target and update client max ea size at that event.
 
 Severity   : enhancement
 Bugzilla   : 15699
 Description: Changelogs
 Details    : Changelogs are a lightweight mechanism to track filesystem
-             metadata and namespace changes.  The changelog is recorded
-             permanently on the MDTs, and is periodically "consumed" / purged
-             when records are no longer needed.
+            metadata and namespace changes.  The changelog is recorded
+            permanently on the MDTs, and is periodically "consumed" / purged
+            when records are no longer needed.
 
 Severity   : enhancement
 Bugzilla   : 15957
 Description: compact fld format with extents
 Details    : Store range of seq rather than every seq in FLD. Seq
-             controller update FLD rather than clients. In Case of CMD, mdt0
-             has FLD, all other metadata server act as non persistent proxy
-             for FLD queries and cache fld entries in fld cache.
+            controller update FLD rather than clients. In Case of CMD, mdt0
+            has FLD, all other metadata server act as non persistent proxy
+            for FLD queries and cache fld entries in fld cache.
 
 Severity   : normal
 Frequency  : rare
 Bugzilla   : 16081
 Description: don't skip ost target if they assigned to file
 Details    : Drop slow OSCs if we can, but not for requested start idx.
-             This means "if OSC is slow and it is not the requested
-             start OST, then it can be skipped, otherwise skip it only
-             if it is inactive/recovering/out-of-space.
+            This means "if OSC is slow and it is not the requested
+            start OST, then it can be skipped, otherwise skip it only
+            if it is inactive/recovering/out-of-space.
 
 Severity   : normal
 Bugzilla   : 16080
 Description: more cleanup in mds_lov
 Details    : not send LOV EA under replay, we can't know about they size at this
-             time. Don't allow client connect to mds before any ost connected,
-             for avoid problems with LOV EA size and returning EIO to client.
+            time. Don't allow client connect to mds before any ost connected,
+            for avoid problems with LOV EA size and returning EIO to client.
 
 Severity   : enhancement
 Bugzilla   : 11826
@@ -294,7 +499,7 @@ Details    : When connection is reused this not moved from CONN_UNUSED_HASH
 Severity   : enhancement
 Bugzilla   : 15899
 Description: File striping can now be set to use an arbitrary pool of OSTs.
-       
+
 Severity   : enhancement
 Bugzilla   : 16573
 Description: Export bytes_read/bytes_write count on OSC/OST.
@@ -1780,7 +1985,7 @@ Bugzilla   : 16450
 Description: Add lockdep annotations to llog code.
 Details    : Use appropriately tagged _nested() locking calls in the places
             where llog takes more than one ->lgh_lock lock.
-       
+
 Severity   : minor
 Bugzilla   : 16450
 Description: Add loi_kms_set().
@@ -1999,6 +2204,48 @@ Description: open file using fid
 Details    : A file can be opened using just its fid, like
             <mntpt>/.lustre/fid/SEQ:OID:VER - this is needed for HSM and replication
 
+Severity   : normal
+Frequency  : Only in RHEL5 when mounting multiple ext3 filesystems
+            simultaneously
+Bugzilla   : 19184
+Description: "kmem_cache_create: duplicate cache jbd_4k" error message
+Details    : add proper locking for creation of jbd_4k slab cache
+
+Severity   : normal
+Bugzilla   : 19058
+Description: MMP check in ext3_remount() fails without displaying any error
+Details    : When multiple mount protection fails during remount, proper error
+            should be returned
+
+Severity   : enhancement
+Bugzilla   : 16823
+Description: Allow stripe size to be up to 4G-64k
+Details    : Fix math logic to allow large stripe sizes.
+
+Severity   : high
+Bugzilla   : 17569
+Description: add check for >8TB ldiskfs filesystems
+Details    : ext3-based ldiskfs does not support greater than 8TB LUNs.
+            Don't allow >8TB ldiskfs filesystems to be mounted without
+            force_over_8tb mount option
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 18793
+Descriptoin: OSS complains "too many blocks" and crashes
+Details    : In filter_commitrw_write():
+            1. lquota_chkquota();
+            2. obdo_from_inode();
+            3. lquota_pending_commit();
+            "2." has changed uid and gid in this case, then caused
+            lquota_chkquota() and lquota_pending_commit() to use
+            different uid and gid. That is the root of the bug.
+
+Severity   : normal
+Bugzilla   : 20463
+Descriptoin: getstripe doesn't report stripe count = -1 sanely
+Details    : Detect and print out the 'stripe count = -1' case properly.
+
 --------------------------------------------------------------------------------
 
 2007-08-10         Cluster File Systems, Inc. <info@clusterfs.com>
@@ -2384,7 +2631,7 @@ Details    : The __iget() symbol export is missing.  To avoid the need for
             this on patchless clients the deathrow inode reaper is turned
             off, and we depend on the VM to clean up old inodes.  This
             dependency was during via the fix for bug 12181.
-       
+
 --------------------------------------------------------------------------------
 
 2007-04-19  Cluster File Systems, Inc. <info@clusterfs.com>
@@ -2419,7 +2666,7 @@ Bugzilla   : 9851
 Description: startup order invariance
 Details    : MDTs and OSTs can be started in any order.  Clients only
             require the MDT to complete startup.
-       
+
 Severity   : enhancement
 Bugzilla   : 4899
 Description: parallel, asynchronous orphan cleanup
@@ -2432,13 +2679,13 @@ Description: optimized stripe assignment
 Details    : stripe assignments are now made based on ost space available,
             ost previous usage, and OSS previous usage, in order to try
             to optimize storage space and networking resources.
-       
+
 Severity   : enhancement
 Bugzilla   : 4226
 Description: Permanently set tunables
 Details    : All writable /proc/fs/lustre tunables can now be permanently
             set on a per-server basis, at mkfs time or on a live system.
-       
+
 Severity   : enhancement
 Bugzilla   : 10547
 Description: Lustre message v2
@@ -2455,7 +2702,7 @@ Bugzilla   : 6062
 Description: SPEC SFS validation failure on NFS v2 over lustre.
 Details    : Changes the blocksize for regular files to be 2x RPC size,
             and not depend on stripe size.
-       
+
 Severity   : enhancement
 Bugzilla   : 9293
 Description: Multiple MD RPCs in flight.
@@ -3724,7 +3971,7 @@ Description: Configuration change for the XT3
             Rather --with-portals=<path-to-portals-includes> is used to
             enable building on the XT3.  In addition to enable XT3 specific
             features the option --enable-cray-xt3 must be used.
-       
+
 Severity   : major
 Frequency  : rare
 Bugzilla   : 7407
@@ -5662,7 +5909,7 @@ tbd         Cluster File Systems, Inc. <info@clusterfs.com>
        * add hard link support
        * change obdfile creation method
        * kernel patch changed
-       
+
 2002-09-19  Peter Braam  <braam@clusterfs.com>
        * version 0_5_9
        * bug fix